Пытаюсь научить ИИ понятию Внутриязыковой Семантической Связности с сопутсвующими метриками и определениями.
Делаю это на английском, с коварными и далеко идущими целями (например, чтобы потом опубликоваться на нём же и наслаждаться реакцией ув. академического сообщества, если оно соизволит заметить, но когда-нибудь кто-то да заметит или сам догадается до того же).
Получаю огромное удовольствие.
Во-1х он мне здорово помог подобрать сам термин, т.е. какое именно слово лучше зайдёт на английском:
coherence, consistency, linkage, connectedness?
Affinity!
С той лишь попракой, что сначала он не понял, что имеется ввиду она же, внутри языка по словам/их когнатам, а не между языками.
Во 2-х, очень приятно, что он такой сообразительный и готовый к напряжению мозга своих нейроцепочек.
Дале прошу его привести примеры семантических цепочек в английском.
Первое, что он выдал было оч. смешно:
antidisestablishmentarianism → antidisestablishment → disestablishment → establishment
honorificabilitudinitatibus → honorificabilitudinitate → honorificabilitudinous → honorificability
floccinaucinihilipilification → floccinaucinihilipilificate → floccinaucinihilipilific → floccinaucinihilipilificator
И т.п..
Тогда я ему даю пример с:
telephone → phonics → symphony → phonetics
Сначала он не смог отойти дале 2х слов, потом смог аж 4, но не дале морфологических форм, т.е. меняя только приставки как у
attract → detract → retract → contract
После введения дополнительных концептов, подсказок и объяснений их ему, стал выдавать отличные результаты:
telephone → phonics → symphony → phonetics (повторил мой)
graphic → biography → autograph → telegraph
Можно долго мучиться и, наверно, найти чисто саксонскую цепочку из боле, чем 3х слов, но ничего, кроме цепочек из 4-х слов латинских первоначальных когнатов, не являющимися морфологическими формами одного и того же слова, мне с ним найти не удалось.
А теперь русский:ладить → клад → кладка → складывать → уклад → владеть → владыка
Причём это едва ли МВСЦ = Максимально Возможная Семантическая Цепочка у данного выбранного языка.
У «складывания» есть ещё близко-родственное «сложение», не говоря о совершенной и несовершенной формы одного по смыслу глагола:
«сложить» и «складывать», сюда же азы арифметики, что этимологически рядом с рифмами и ритмами :)
- … которые тоже лады.
Прошу его теперь анализировать эту цепочку… Но он выхватывает только одно значение у слова (скажем, у мнозначного «лад»/«ладить», вплоть до «ты (как) (за)ладишь одно и то же», он берёт только значение «to get along, to harmonize» - ладить в смысле не ссориться/не спорить, соглашаться).
И не может проводить связи до когната «лад».
Помнится, программка поиска всех морфологических форм - mystem, - Ильи Сегаловича использовалась очень активно, но она писалась по словарю морфологических форм русского языка, т.е. только склонения/спряжения/падежи для одного и того же слова.
А вот научить машину самостоятельно находить Семантические Цепочки и все Максимально Возможные Семантические Цепочки в данном языке… - и тут же тогда автоматом будет метрика по старшинству/автономности развития в данной группе языков, по которым эти цепочки будут выписываться.
Пишу это так открыто и свободно (ибо меня толкают локтем, типа «не дари идею, паразиты стащат и испохабят») - потому что
(а) не представляю себе, что кто-либо выдаст финансирование на такие работы, и/или кто-то способен их самостоятельно провести за свой счёт, притом качественно
(б) есть тонкости понятий и специфика обучения такой автоматической метризации языков в зависимости от… в т.ч. от того, к какому типу принадлежит язык и был ли он такого типа всегда (агглютинативен ли он, т.е. как именно слова происходят друг от друга - часть языков вообще состоят как бы, или на первый взгляд, из слов, которые вообще никак друг с другом не связны или связны чисто омонимично).
(в) полноценно владеющих хотя бы даже только русским языком среди нас всё меньше и меньше (за примерами далеко ходить не надо, не так ли?…), а возраст таких носителей всё старше и старше… а уж чтобы человек ещё хорошо схватывал/чувствовал другие языки, т.е. имея возможность помогать системе научиться составлять семантические цепочки - так это вообще редкость…
Пока что вот такие результаты обучения и выводы самого ИИ про цепочку выше, на основе поправок…
The meanings associated with "ладить" enrich our understanding of the entire word chain. Each word reflects aspects of assembly, arrangement, and authority, showcasing how they propagate into novel semantic concepts while remaining connected to their origins. This highlights the genuine nature of the semantic relationships within this chain.
The inclusion of "repeat" as a meaning for "ладить" enhances the semantic connections within the word chain. It emphasizes themes of continuity, assembly, and organization, reflecting how these concepts propagate into novel meanings while remaining anchored in their origins.
=
Значения, связанные с "ладить", обогащают наше понимание всей цепочки слов. Каждое слово отражает аспекты сборки, расположения и авторитета, демонстрируя, как они распространяются в новые семантические концепции, оставаясь связанными со своими истоками. Это подчеркивает подлинную природу семантических отношений в этой цепочке.
Включение "повторить" в качестве значения для "ладить" усиливает семантические связи в цепочке слов. Оно подчеркивает темы непрерывности, сборки и организации, отражая, как эти концепции распространяются в новые значения, оставаясь закрепленными в своих истоках.
(автоперевод)
P.S. в испанском, хотя иногда и путаясь, приплетая почему-то синонимы (загадка…) совсем другого корня, но сразу стал выдавать по 5 слов в цепочке:
Luz → Iluminar → Luminoso → Luminiscencia → Eluminación
Sonido → Sónico → Resonancia → Sonoridad → Insonorización
Последние два уже почти специфичны, но однако же…)