Семантические координаты

Nov 04, 2012 21:15

Возьмем словарь синонимов и антонимов. Для каждого слова (или значения слова) даются синонимические значения и противоположные. Какую интересную информацию о языке можно выделить, механически получить, переработав этот словарь? В статье [1] описывается удивительно простой и изящный подход, приведший к получению весьма нетривиального результата.

Возьмем все слова... )

math, scipop, linguistics

Leave a comment

Comments 108

(The comment has been removed)

fregimus November 5 2012, 06:27:18 UTC
Нет, почему же, очень в тему. Чистых синонимов, конечно, практически нет - они избыточны и исчезают, обычно значение одного из синонимов изменяется. Но этот метод показал себя очень устойчивым. Например, угол между векторами синонимов должен быть в идеале 0°. Авторы обнаружили слова, торчащие под почти прямым углом, которые числились синонимами, но по смыслу явно не подходили (посмотрите, статья очень интересная). То есть, система выстроилась несмотря на ошибки, а ошибки эти стали заметны.

Reply


Просто интересно livejournal November 5 2012, 06:20:15 UTC
User alex_bykov referenced to your post from Просто интересно saying: [...] Оригинал взят у в Семантические координаты [...]

Reply


alexeim November 5 2012, 06:26:38 UTC
А значения четвертой оси для разных языков они приводят? Может быть, четвертая ось отражает национальный характер ;).

Reply

fregimus November 5 2012, 06:28:34 UTC
Да, приводят. Copioous/essential, избыточный-необходимый в одном из случаев. Посмотрите статью, если будет время. там намного больше и интереснее.

Reply


stoshagownozad November 5 2012, 06:49:38 UTC
интересно, каков "физический смысл" этой энергии системы...

мне напоминает, на моем чудовищно низком уровне знаний и представлений, те штуки, которые, наверное, математики и физики делают, когда рассматривают теорию суперструн - измерений-то может быть и 17, и 25, и не помню сколько там ещё... но с очень большой вероятностью весь реальный мир укладывается в четыре...а остальные "вырождаются"...

может ли быть, это свойство примененной математики? т.е., тех правил (аксиом?), которые лежат в основе модели?

я даже слов боюсь, которые я тут написала, но просто аналогия поразила... что геометрия любого пространства - будь то пространство физическое или языковое - сводится все равно к 4 измерениям...

Reply

fregimus November 5 2012, 06:57:04 UTC
Физический смысл очень простой. Член с произведением векторов при W=1 максимален (энергия минимальна), когда векторы сонаправленны, при W=-1 - когда противонаправленны. Все остальные пары не вносят в энергию никакого вклада (W=0). Полная энергия будет минимальна, когда антонимы максимально растопырятся, а синонимы максимально сойдутся. Второй член, с 4 степенью, всего лишь нужен, чтобы частицы не разбегались далеко. Он симметричен, и поэтому не сказывается на направлении векторов ( ... )

Reply

stoshagownozad November 5 2012, 07:20:43 UTC
я-то статью ещё почитаю... но как же плохо иметь трудности с пониманием математики как таковой... ых!

вообще говоря, корпусов языковых же много... и составлялись они разными людьми, и, может быть, даже по несколько разным принципам, а взять не европейские языки и попробовать? глядишь, и выявится что-нибудь...

ужасно интересно. видно что-то, но действительно непонятно даже, что именно :) как бы там ни было, мне сдается, что и принципы построения словаря, и свойства думания (ведь размышление - это тоже использование языка), и даже методология создания семантической карты - это все равно "свойства языка", в том, что касается, наверное, ужасов семантики... так что вычленять-то их придется с помощью того же языка, т.е., вроде как за волосы себя тащить из болота?

а ведь есть ещё искусственные языки... вот интересно, как там с этим делом обстоит...

Reply

lenivtsyn November 5 2012, 09:16:56 UTC
А, может быть, авторам нужно было рассматривать язык в динамике: не просто, как связаны между собой слова, а как возникали и менялись связи? Тогда стало бы яснее, "чьи" свойства.

Reply


levkonoe November 5 2012, 07:15:31 UTC
очень интересно.

Reply

fregimus November 5 2012, 08:12:06 UTC
Рад, спасибо.

Reply


Leave a comment

Up