Comments | nchudova: Про модную болезнь

nchudova

Про модную болезнь

Jan 28, 2025 23:30

, про «общение» с нейросетями

https://vad-nes.livejournal.com/826765.html

https://author.today/post/352007

Из вывода ЧатЖПТ: Таким образом, постановление от 9 сентября 1933 года о детской литературе стало важной вехой в советской ( Read more... )

Comments 68

calcin January 29 2025, 09:23:15 UTC

Я не очень понимаю, что люди хотят от перекаченного, на стероидах, аналога Т9.

Задача современного генеративного ИИ - сгенерировать текст или изображение, похожее на написанное человеком. Средним человеком.

В данном примере ИИ с этим блестяще справился: эксперт ведь явно указал, что такой текст мог написать студент гуманитарного вуза с либеральным уклоном.

И что ещё от него требовать? Обучите ИИ на большом объеме текстов советских авторов - будет другой результат.

-----------------

Просто основной объем советских текстов - он был создан в доцифровую эпоху. И, даже если книги/статьи/газеты оцифрованы - объем текста, созданный и выложенный в Интернет - его превосходит на порядки. А ИИ обучают именно на текстах из интернета.

nchudova January 29 2025, 12:22:43 UTC

сгенерировать текст или изображение, похожее на написанное человеком - а зачем? Вы, видимо, про эти методы что-то знаете, вот что там пишут про цели этой генерации?

vchernik January 29 2025, 10:19:51 UTC

Ну ещё один "ЗАБОР" построен (строится прямо на глазах) - ну и что? Мало их? Или в этом сезоне надо именно на этот бросаться?

ИИ накидал мне десяток фальшивых книг.
Но одну книгу настоящую накинул: Christopher Boehm "Hierarchy in the Forest: The Evolution of Egalitarian Behavior". Я её уже перевёл, правда, машинным переводчиком и кучу огрехов перевода вижу даже я. Ну и что? Ждать в мои 75 лет, когда кто-то сподобится её перевести и куча редакторов подвинет свои ЗАБОРЫ и отредактирует её?? Я не возражаю, если кто-то хочет дождаться. Но мне некогда. У меня свой ЗАБОР;-))

alaev January 29 2025, 14:11:42 UTC

Можно мысленно расшифровать ИИ как Интеллектуальное Испражнение и переживать поменьше. Про больных важный и интересный пример. Не думаю, что кто-то всерьёз планирует в ближайшем будущем заменять хороших специалистов на ИИ. Это какие-то пустые страхи ( ... )

strannick_ru January 29 2025, 18:04:49 UTC

> Итак, чатЖПТ занимается переписыванием истории, в буквальном смысле слова. А чем ещё он занимается - я не знаю, но думать о нём мне противно!

он ничем не занимается.
понимаете, ваша фраза звучит как "Итак, печатная машинка занимается переписыванием истории, в буквальном смысле слова. А чем ещё он занимается - я не знаю, но думать о нём мне противно!"

печатная машинка не можетт заниматься переписыванием истории.
фотошоп не может заниматься ретушью фотографий.

это просто инструменты.
и опаснее всего не они сами (ножом можно резать масло, а можно - человека), а те, кто пишут НЕЙРОСЕТЬ СКАЗАЛА!!11
нашли, блин, бога из машины. Нейросеть говорит то, что от неё хотят. Печатная машинка печатает то, что хочет автор.

Нейросеть - это замечательный секретарь, который подберёт вам материал, который нужно осмысленно обработать.
Проблема не в нейросети. Проблема в тех, кто видит в ней кнопку "сделать заебись".

Приведённый пример показывает, что если забивать отвёрткой гвозди - получается фигня.
А при всём уважении к Вадиму Нестерову, как к автору (у ( ... )

nchudova January 31 2025, 00:29:48 UTC

Вы чего к словам цепляетесь? Сами никогда не говорите "поставь голову на место" или "у меня мозги закипают" или даже "его мозг решил, что..."? Но я Вам благодарна за ссылку, которую увидела в Вашем посте, пусть и у меня полежит.

https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/

Кстати, моя коллега по лабе как раз там и работала долгие годы, но как полноценный лингвист (ОСиПЛ филфака МГУ) перебралась к нам, в академический ин-т. А теперь вот нейросетевой подход достал её и здесь, в науке. И мы с ней горюем вместе - работать же стало невозможно! (вот без секретаря я обойдусь, а программисты для создания новых методов для психологии больших групп мне нужны)

strannick_ru January 31 2025, 10:40:28 UTC

прошу прощения, был взволнован, излишне резко написал.
но ваш пост меня и сподвиг свой написать.

nchudova January 31 2025, 00:40:30 UTC

Ещё пришлось объясняться в ВК, выложу сюда свои комменты.

Я ничего такого "субъектного" про нейросети, большие языковые модели и генераторы текстов не думаю. Субъектами деятельности, приводящей к а) заполнению третьего мира Поппера конфабуляциями ("галлюцинациями"), б) "переносу ответственности" и в) дезориентации населения, я считаю программистов, бизнес и государства, поддерживающие такой бизнес.

А так нормально всё, болезни роста, когда-то нейросети были милым и мирным инструментом распознавальщиков, а теперь вот... Теперь вот они лично мне портят жизнь - кончилась моя работа по созданию методов текстовой социально-психологической диагностики. Теперь программисты только с LLM работать готовы, моделирование работы эксперта-диагноста они уже делать не хотят, баре все стали, за них машобучение пашет! Ну а результаты - ожидаемые, я их описала в посте для одного маленького примера.

Если кто-то готов возразить содержательно и разъяснить мне на пальцах как можно сделать классификатор на LLM надёжным и валидным инструментом распознавания в ( ... )

alaev February 4 2025, 15:07:45 UTC

- И вот результат - где 27% правильного распознавания, где 20%... А F-мера высокая, даже точность и полнота не ниже 70.

Честно говоря, я пока не смог понять постановку проблемы. Если у вас есть алгоритм, который правильно распознаёт 20% случаев, это плохой, мусорный алгоритм. Если есть какая-то F-мера, которая вместо оценки "мусор" даёт что-то высокое, это плохая, мусорная мера. О чём тут вообще можно говорить? Вас начальство заставляет пользоваться этим алгоритмом? Надо ему показать пример с 20% правильных ответов.

nchudova February 4 2025, 16:05:46 UTC

Это ж не я пользуюсь, это в машобучении есть такие показатели эффективности модели - полнота, точность, некая производная от них (F1-мера). И у программистов не принято вручную перепроверять результаты автоматической классификации. Ни в каких статьях (наших или западных) не встречала упоминания о таком этапе работы. Ну а мне это непривычно и я просто попросила дать мне таблицу высказываний с результатами машинной разметки. Потыкалась в разные места этой таблицы (там было порядка 1000 высказываний) и разметила 100 высказываний. Для одного класса совпала с машиной в 27 случаях. Потыкалась ещё, уже выделяя другой класс - там ещё хуже. Вот сейчас в другой работе аналогичная ситуация - тексты больных машина распознаёт почти всегда так же как я, а тексты здоровых почти всегда относит к текстам больных. Программистам рассказала. Они удивлены. Пока объяснений от них не добилась. Почему это их не смущает (а это разные люди, даже из разных отделов) не понимаю. Ёжики кололись, плакали, но...

alaev February 4 2025, 16:46:40 UTC

Не видя конкретной задачи, я вряд ли хорошо всё пойму. Но, вообще, не существует какого-то единого алгоритма под названием "машинное обучение". Там куча настроек, параметров, эти настройки можно выбрать правильно, а можно неправильно.

Единственный способ понять, правильно ли выбраны настройки - запустить алгоритм и сверить результат с мнением экспертов. Как ещё-то? Если эксперты говорят, что результат мусорный, значит попытка не удалась, что-то надо менять.

У вас есть 1000 высказываний - вам их нужно разбить на конечное число классов? Сколько этих классов?

Thread 11