Comments | cinecon: ИИ-2

cinecon

ИИ-2

May 26, 2024 01:46

Крику много, толку нет. Сначала все сюда. https://news.rambler.ru/tech/52817446-iskusstvennyy-intellekt-slomal-samuyu-populyarnuyu-poiskovuyu-sistemu-v-mire/

Это ровно то, что предсказывалось в посте «Искусственный интеллект» https://cinecon.livejournal.com/55660.html Кто не видел, лучше посмотреть.

Копнул тему чуть глубже и вот что увидел: «На ( Read more... )

искусственный интелект, министр Шадаев, Яндекс, baidu, chatgpt, Сбербанк, ИИ, Ашманов, вице-премьер Чернышенко, Г. Греф

Comments 18

blagorazumnaya May 26 2024, 06:00:08 UTC

Иероглифы сложны визуально, а латиница упрощена. Скорей всего, создадут нечто среднее: буквы со смыслом и отражением многонародных звуков -- чем, не старославянская глаголица ? Пусть там наши учёные мужи подсуетятся )))

trocepins May 26 2024, 08:37:42 UTC

О том и речь, что для ИИ визуальной сложности не существует.

cinecon May 26 2024, 12:29:33 UTC

У меня тоже что-то подобное крутилось в голове. Для Метаязыка отлично подошёл бы Эсперанто. А прикладные (отраслевые) сегменты вполне можно было бы писать на национальных языках и профессиональных терминах.

thesz May 26 2024, 12:07:57 UTC

https://translate.google.com/?sl=auto&tl=en&text=%E6%96%BD&op=translate

У иероглифа 施 не менее 9 значений.

Я взял первый иероглиф из статьи про "Ши ши ши ши ши:" https://ru.wikipedia.org/wiki/%D0%A8%D0%B8_%D0%A8%D0%B8_%D1%88%D0%B8_%D1%88%D0%B8_%D1%88%D0%B8

Возможно, это имя.

Возьмём последний иероглиф стихотворения: 事

https://translate.google.com/?sl=auto&tl=en&text=%E4%BA%8B&op=translate - не менее 7. Среди смыслов есть "circeumstance," "reason" и "case."

cinecon May 26 2024, 12:49:09 UTC

Если Вы думаете, что приведённые Вами примеры остановят китайцев и они перейдут на английский, то может быть Вы и правы. Но ведь проще этот иероглиф подправить графически и вложить полученную иерархию в тезаурус.

thesz May 26 2024, 13:30:54 UTC

Международный английский стремится к китайскому, английский становится более "позиционным."

Мои примеры были про наличие в китайском достаточного количества неоднозначностей, что прямо противоречит утверждению про "один символ - один смысл." Китайский достаточно стар, чтобы в нём "один символ - один смысл" не могло существовать. Есть у меня предположение, что достаточно лет пятидесяти использования языка типа английского или китайского, чтобы заметное число слов приобрело несколько смыслов. Особенно, если использование будет географически разнесено.

Русский сопротивляется этому связью слов через род, число и падеж.

Ещё в китайском есть фразы типа "путь по саду," в которых заключительное слово может менять смысл всей фразы: https://aclanthology.org/W06-0105.pdf

В русском такого добиться тяжело.

Так что, если уж и переходить на какой язык, так это на русский.

cinecon May 26 2024, 17:31:34 UTC

Не могу тягаться с Вами в знании китайской и английской фолологии. Я тут уступаю Вам два порядка. Но есть у меня сильное подозрение, что универсальным и международным будет именно Метаязык самого верхнего уровня. И даже игрушки с переводом ChatGPT на русский могут почти нормально вписаться где-то на нижних этажах тезауруса. А для Метаязыка вариантов всего два: или английский (ни русский, ни тем более китайский с ним тягаться не могут), или Эсперанто. А корневые сегменты национальные разработчики могут писать на любом языке.

5vsadnik May 27 2024, 06:35:24 UTC

cinecon May 27 2024, 17:49:26 UTC

Это просто прекрасно. Но есть ли у всех этих великолепных успехов общий Метаязык? Или это очередные гладеньгие бредогенераторы, побыстрому переведённые с английского?

5vsadnik May 27 2024, 17:58:38 UTC

ext_2878955 May 28 2024, 18:03:13 UTC

> Они начнут создавать лингвотезаурус (естественно на английском)
Ну, вообще-то есть такая штука - OWL, язык веб-онтологий. Сама по себе она предназначена для работы reasone-ов, решателей (рассуждателей) на базе некоторых формальных логик, но ничто не мешает подключать это к нейросетям в качестве вспомогательных модулей.

ЗЫ. и всё-таки надо заметить, что упомянутые нейросети сами составляют свой тезаурус при обучении посредством лингвистических моделей, только этот тезвурус "зашит" в весовые коэффициенты определённых слоёв.

cinecon May 29 2024, 22:55:47 UTC

Первый абзац не понял вообще, просто отстал от жизни. Расшифровывать не надо, всё равно вникать не буду.

По второму. " нейросети сами составляют свой тезаурус при обучении посредством лингвистических моделей", ничего они сами не составляют, ассистенс получают задание про перелопачиванию неких текстов. смотрят на ответ, отправляют его работодателям, а там решают, что с этим делать. Вот простое доказательство Вашего заблуждения. В словарях для слов не предусмотрены никакие весовые категории. Смысл определяется только через другие Смыслы. И никакие вероятности здесь не нужны. По сути они просто запрещены. Смыслы по определению дискретны. Как только Вы переходите к вероятностям, Вы попадаете в двумерный граф, Задайте такому ИИ один и тотже вопрос 1000 раз подряд, и у Вас выскочит 100-150 не стандартных ответов, просто в розыгрыше вероятностей выпадали не самые вероятные варианты. Усё, где у Вас гарантии, что такой нестандартный вариант не выпадет при Вашем единичном испытании? Вот именно от этой ошибки Вас и страхует детерминированный ( ... )

ext_2878955 May 30 2024, 18:24:34 UTC

Кхм, простите - не соглашусь.
Во-первых, весовые коэф-ты (веса входов) к вероятностям отношения не имеют, эти веса - самая суть нейросети, то есть набор весов и есть нейросеть.
Во-вторых, если Вы посмотрите в википедии статью "Большая языковая модель", то там сразу чётко указано - "это языковая модель, состоящая из нейронной сети со множеством параметров (обычно миллиарды весовых коэффициентов и более), обученной на большом количестве неразмеченного текста с использованием обучения без учителя.", то есть - сама.

ЗЫ. по поводу OWL, общий смысл следующий - веб-онтология и есть тезаурус (словарь), но только понятий, а не слов, то есть тут языки как бы отдельно. Затем веб-онтология используется как "база знаний" (это чуть более сложная концепция, чем "база данных") для более глубокого понимания запросов и интеллектуального поиска информации, простой поиск по ключевым словам уходит в прошлое.

cinecon May 30 2024, 21:11:59 UTC

Вот с этого и начнём: " OWL, общий смысл следующий - веб-онтология и есть тезаурус (словарь), но только понятий, а не слов, то есть тут языки как бы отдельно. Затем веб-онтология используется как "база знаний" (это чуть более сложная концепция, чем "база данных") для более глубокого понимания запросов и интеллектуального поиска информации, простой поиск по ключевым словам уходит в прошлое". Смотрите, что Вы написали: понятия - база знаний - база данных. Прекрасный трёхэтажный тезаурус (с внутренними слоями на каждом этаже), где "понятия" и есть Метаязык. И обратим внимание, что я нигде, ни в ИИ, ни в ИИ-2, не говорил, что существующие нейросети это плохо. Я говорил о том, что пока эти нейросети двумерные, и их надо превращать в N-мерные, и что их надо сращивать с тезауросом (на обычном языке), а сверху накрывать всё это Метаязыком.

Thread 6

ext_2715974 May 31 2024, 11:14:02 UTC

Несколько замечаний ( ... )

cinecon May 31 2024, 16:38:58 UTC

Спасибо, было очень познавательно. Сидя дома отстаёшь от жизни.