Семантические координаты

Nov 04, 2012 21:15

Возьмем словарь синонимов и антонимов. Для каждого слова (или значения слова) даются синонимические значения и противоположные. Какую интересную информацию о языке можно выделить, механически получить, переработав этот словарь? В статье [1] описывается удивительно простой и изящный подход, приведший к получению весьма нетривиального результата.

Возьмем все слова... )

math, scipop, linguistics

Leave a comment

fregimus November 5 2012, 06:57:04 UTC
Физический смысл очень простой. Член с произведением векторов при W=1 максимален (энергия минимальна), когда векторы сонаправленны, при W=-1 - когда противонаправленны. Все остальные пары не вносят в энергию никакого вклада (W=0). Полная энергия будет минимальна, когда антонимы максимально растопырятся, а синонимы максимально сойдутся. Второй член, с 4 степенью, всего лишь нужен, чтобы частицы не разбегались далеко. Он симметричен, и поэтому не сказывается на направлении векторов.

Модель совершенно симметрична сферически, H не меняется при повороте всех векторов вместе, поэтому никаких тенденций к сворачиванию решения к меньшему числу измерений она не вносит. Так что это именно свойство системы связей синонимов-антонимов.

Сложность возникает дальше - это свойство языка? Или человека, думающего над словарем? Или методологии построения словаря? Или, может быть, методологии отбора корпуса, который он обрабатывал? Все эти вещи, и многие другие, потенциально вносили свой вклад, и как их вычленить и учесть - задача куда более сложная.

Доб. То, что именно 4 измерения - безусловно, простое совпадение. Да и оставшиеся измерения вовсе не так плотно свернуты, как измерения в теории струн (там все-таки доли процента остаются, вполне ощутимая величина, а в физике струн - там порядки чуть ли не планковские).

Reply

stoshagownozad November 5 2012, 07:20:43 UTC
я-то статью ещё почитаю... но как же плохо иметь трудности с пониманием математики как таковой... ых!

вообще говоря, корпусов языковых же много... и составлялись они разными людьми, и, может быть, даже по несколько разным принципам, а взять не европейские языки и попробовать? глядишь, и выявится что-нибудь...

ужасно интересно. видно что-то, но действительно непонятно даже, что именно :) как бы там ни было, мне сдается, что и принципы построения словаря, и свойства думания (ведь размышление - это тоже использование языка), и даже методология создания семантической карты - это все равно "свойства языка", в том, что касается, наверное, ужасов семантики... так что вычленять-то их придется с помощью того же языка, т.е., вроде как за волосы себя тащить из болота?

а ведь есть ещё искусственные языки... вот интересно, как там с этим делом обстоит...

Reply

lenivtsyn November 5 2012, 09:16:56 UTC
А, может быть, авторам нужно было рассматривать язык в динамике: не просто, как связаны между собой слова, а как возникали и менялись связи? Тогда стало бы яснее, "чьи" свойства.

Reply

golosptic November 7 2012, 02:36:16 UTC
Очень хорошая идея, сам хотел об этом написать.
Тут сложность, к сожалению, только в том, что довольно тяжело найти словари синонимов-антонимов в длительной динамике развития какого-то языка - попросту не наработан материал.
Но, тем не менее, можно было бы предсказать, что дополнительные измерения 'накапливаются' по мере развития языка.
Т.е. если взять какую-нибудь архаическую форму древнегреческого, к примеру, то там их, скорее всего, будет меньше, чем в классическом.
Было бы очень интересно попытаться найти язык, для которого три заявленные постоянные оси не соблюдаются.

Reply


Leave a comment

Up