Программерско-лингвистическое

Dec 12, 2009 11:26

В феврале, как вы помните (если помните), я защитил диплом по компьютерной лингвистике. В процессе написания той программы для анализа языка было допущено множество разных неудачных и странных решений, но необходимый опыт я всё-таки получил. Тогда же примерно у меня возникла идея переписать всё это иначе, без привязки алгоритмов к русскому языку. ( Read more... )

Игры будущего

Leave a comment

Comments 8

sam_broock December 12 2009, 16:37:05 UTC
Комментов нет просто потому, что все замерли в благоговейном молчании.

Reply

ur_quan1986 December 12 2009, 19:09:28 UTC
Да, я сам себя уже боюсь :)

Reply


nikiforov December 12 2009, 16:47:59 UTC
А для кетайского слабо, м?

Reply

ur_quan1986 December 12 2009, 19:05:40 UTC
Ну, если перечислить все их букофки, то не слабо будет :)

Reply

sam_broock December 12 2009, 19:45:01 UTC
В принципе китайцы ведь посылают друг другу эсэмэски, там как-то на фонемы слова делятся.

Reply


savamura December 12 2009, 17:41:32 UTC
Я тут недавно вспомнил про твой диплом, когда думал про штуку, которая бы нападала на какое-нибудь длинное обсуждение чего-либо, например, темы на форуме, и строила в майнд-мепо-подобном представлении «развитие мысли» обсуждения и сводный укороченный «конспект» обсуждения, отрезая всякие флудовые комментарии, но тут без семантического анализа не обойтись.

Reply

savamura December 12 2009, 17:45:02 UTC
В общем, я пытался как-то представить алгоритм, вычленяющий семантические связи внутри предложения, особенно внутри короткого предложения. Например, всеми любимый твиттер состоит из коротких сообщений, которые, как мне кажется, достаточно легко кластеризовать по смыслу. А обсудить это не с кем :)

Reply

ur_quan1986 December 12 2009, 19:08:23 UTC
Ага, всё это очень интересно :) Я готов обсуждать, можно что-нибудь подобное замутить.
Но перед семантическим анализом ещё потребуется выполнить большую работу по подготовке соответствующего инструментария. Синтаксический анализ текста сделать вполне реально, а вот насчёт дальнейшей обработки я пока глубоко не думал.

Reply


Leave a comment

Up