Токипона и семантический поиск

Oct 07, 2009 19:24

С некоторой натяжкой этап семантического анализа в "семантических" поисковых машинах можно сравнить с процессом перевода. Поисковик как бы переводит текст "для себя", в свой внутренний язык ( Read more... )

поиск, идеи, искусственные языки

Leave a comment

Comments 10

earwin October 7 2009, 19:11:00 UTC
Одна из ключевых идей токипоны в том, что описания контекстнозависимы. Один и тот же предмет/явление может быть назван по разному в зависимости от своей роли, от отношения к нему говорящего.
Именно поэтому скажем лишены смысла словари токипоны которые пытаются дать тебе готовые конструкции для не вошедших в основу слов.
Именно поэтому машинный перевод на токипону нереален, у него нет контекста.

Reply

earwin October 7 2009, 19:20:04 UTC
Для примера, утку я могу перевести как:
waso telo - водяная птица
waso moku pona (могу наврать с грамматикой) - вкусная птица (птица которую хорошо есть)

Тут мы кстати натыкаемся на то что перевод односторонний. В обоих версиях я заострил внимание на какой-то конкретной, важной мне в этот момент характеристике птицы, и под эту характеристику может подпасть какая-то другая птица.

Reply

alsafr October 7 2009, 20:03:47 UTC
Не вижу в этом ничего, что помешало бы использовать токипону для задачи поиска. В данном случае точный перевод вообще не важен, достаточно приблизительного перевода, который вполне реален.

Reply

earwin October 7 2009, 23:03:40 UTC
Чудовищная неоднозначность перевода тебе не мешает? Ну то есть не проблема, ты можешь набить словари бессмысленными вне контекста фразами, можешь перевести текст на эту псевдо-токипону, и можешь по нему искать. А смысл?

Reply


Тихомиров Илья (Exactus) anonymous October 19 2009, 11:31:25 UTC
Мы задавались вопросом использования искусственного языка в качестве модели представления текста. Однако, подходящих языков так и не нашли. Есть подозрение, что их просто нет. Основная причина - при трансляции возникает проблема отображения разных конструкций ЕЯ в одинаковые конструкции искусственного языка (ИЯ) и наоборот, когда разным конструкциям ИЯ соответствуют одинаковые конструкции ЕЯ. В итоге мы пришли к выводу, что текст надо представлять в виде ситуационно-реляционной модели, в основу воторой положены слова ЕЯ с искусственными надстройками (синтаксические и семантические связи, семантические значения и т.д.).

Reply

Re: Тихомиров Илья (Exactus) alsafr October 20 2009, 09:21:05 UTC
Спасибо, Илья, очень интересно.
Кстати, было бы интересно узнать: используются ли синонимы в вашей модели представления?

Reply

Re: Тихомиров Илья (Exactus) anonymous December 25 2009, 13:28:59 UTC
Тихомиров Илья: да, используются. Но тут возникает еще одна проблема - синонимы контекстнозависимы (в одном контексте синонимы являются таковыми, в другом - даже близко не стояли). Соответственно, гарантировать с синонимами ничего нельзя. Они могут улучшить полноту поиска, но никак не точность.

Reply


Leave a comment

Up