syntactic web

Feb 10, 2008 06:15

Скоро ли, интересно, поисковые машины научатся не только морфологии, но и синтаксису?
К примеру, чтобы по запросу "кошка на крыше" находились документы вида "кошка [обстоятельства] [глагол] на [определения] крыше", такие, как "кошка на раскалённой крыше" или "кошки нахально сидят на крыше", но документ "кошки и крыши" не находился бы или был бы в хвосте. Разумеется, согласование глагола с существительным тоже должно учитываться, как и разбиение на придаточные предложения: документы типа "кошка в доме, а кот на крыше" или "кошка видит: птицы сидят на крыше" не должны попасть в выдачу.

Поисковик должен будет, кроме обычного набора слов документа, хранить деревья синтаксического разбора предложений. В продвинутом случае можно хранить и связи между предложениями, например, для раскрытия эллиптических конструкций вида "Вот кошка. Она сидит на крыше".

Это ещё не semantic web, но уже намного интереснее поиска по бесструктурному набору слов.

virtual, idea, lang

Previous post Next post
Up