У Игоря Ашманова, патриарха российского компьютинга, появилась еще в июне важная статья - "Статистика и прагматика «сильного ИИ». Одурение эпигонов." Этот текст - заметки с Петербургского экономического форума (5-8.06.24), где обсуждалась проблема Искусственного интеллекта (ИИ)...
https://sponsr.ru/ashmanov/57687/Statistika_ipragmati.. Получилось так, что я сам в это время был в Питере на конференции по ИИ, только конференция сия проходила "на полях форума" (то есть денег за участие не брали и к большим людям не пускали))). В своей статье И.С.Ашманов критически разобрал непомерные восторги российских и зарубежных пропагандистов ИИ, произвел разделение алхимических мух и реальной прагматики. Ашманов справедливо утверждает, что ИИ никаким интеллектом не обладает, а просто алгоритмически перераспределяет слова - как в мысленном эксперименте Джона Сёрла "Китайская комната". Так и есть!
Статью советую прочитать. Вот фрагмент: "...с полей ИИ-войны приходят страшные вести, что дело даже не в триллионных деньгах и потолке производства графических карточек - в Интернете тексты кончились. А в узких предметных областях их и никогда не было достаточно для «самообучения» БЯМ. В результате попытки использовать большие языковые модели в реальной деятельности, с приемлемым качеством, приводят - в 2024 году, в пору великого триумфа БЯМ! - к необходимости нанимать лингвистов, составлять онтологии, фиксировать конкретные лексические реализации признаков и т. п. А это внезапно дорого - против обещаний, что теперь надо только кнопку нажать..."
Отмечу: проблема обозначена очень точно. Например, наш стартап "Институт оценки информации" столкнулся с этим - мы применяем БЯМ (LLM) для анализа текстов сейсморазведочных отчетов, и наша основная трудность: нехватка текстов по данной предметной области (отчеты по сейсморазведке все разложены по конфиденциальным архивам, в открытой Сети их нет, а заказывать их по одному в Геолфонде - сложно.) Сообразно этому, мы создаем онтологии, применяем семантические техники, и уже столкнулись с нехваткой средств. Между тем, в Америке и в Китае в этом направлении продвижение существенное (Christine Noshi, Jerome Jacob Schubert. A Brief Survey of Text Mining Applications for the Oil and Gas Industry. International Petroleum Technology Conference March 2019. Miao Tian, Kai Ma, Qirui Wu… Joint extraction of entity relations from geological reports based on a novel relation graph convolutional network, Article, May 2024, Computers & Geosciences.). Мы должны догонять. Мир - жестокая штука.
.........................................................................
PS Что касается опасностей ИИ, вспоминается культовый сериал "Силиконовая долина", где стартаперы создали нейросеть, которая для обучения на новых текстах, начала взламывать все шифры - дабы вводить в свой оборот всё новые и новые файлы... Стартаперы решили систему похерить "от греха подальше", но флешка с опасным ПО в итоге пропала куда-то... По сюжету получается, что одна умненькая сотрудница передала флешку в АНБ.))) Так что намек создателей фильма ясен: готовьтесь к компьютерной атаке из-за океана...