"Итак, чатЖПТ занимается переписыванием истории, в буквальном смысле слова. А чем ещё он занимается - я не знаю, но думать о нём мне противно!"
ничем он не занимается. вы находитесь в рамках конечной статистической машины https://e2k-4d-x-ussr.livejournal.com/2300543.html, которая вам в рамках своей модели и набора данных производит интерполяцию по вашему запросу причём практически не выходя за рамки исходного статистического пространства, заданного набором данных.
То есть, если вы взяли писалово перестроечных либералов, блохеров, воспитанных и идеологически заправленных в 90-е, то получите как результат интерполяций "бред осмысленный ... на уровне неглупого студента-бездельника, начитанного молодого человека, который прекрасно понимает, что нужно рассказывать про литературу в сталинские годы" в рамках либероидного дискурса. То есть ЧатГПТ дал всё это усреднение перестроечной либерды и интеллехтуалов со светлыми лицами, потому что ничего другого у него в картине данных не было.
Ну а для вашей "ИИ (алгоритм предобучен на русскоязычных больших корпусах и дообучен на корпусе текстов наших испытуемых)" результат показывает, что дообучен алгоритм херово, и ваших спецов "пред/до-обучальщиков" как постановщиков задачи и специалистов надо где-то списывать в утиль или немного и больно бить, если всё же нужен результат.
Эх, Вашими устами... Да, хорошо бы большие языковые модели появлялись бы в результате машобучения на хорошо составленных корпусах. И любой чат-бот, бегающий по запросам пользователя, приносил бы результаты только из источников, заслуживающих доверия и лишённых тенденциозности. И хорошо бы, чтобы в машобучении было принято проводить повторную разметку объектов (текстов), а не ориентироваться только на F-меру. И здорово было бы в задачах автоматического анализа текста и текстопорождения использовать представления о жанрах речи и достижения функциональной грамматики. И т.д. и т.п. Тогда это всё и можно было бы считать методами ИИ - как о них говорится в профессиональной литературе https://www.litres.ru/book/gennadiy-osipov/metody-iskusstvennogo-intellekta-16958847/
вот хотел вам в начальном комменте рассказать личную байку про магию статистики из 90-х. или чем оказалась дешифрованная программа, определяющая есть ли у человека рак по его десятиминутной кардиограмме. написал, стёр, теперь понимаю зачем мне хотелось это сделать.
изюминка текущих моделей ИИ заключается в том, что вот это метапрограммирование статистических моделей позволяет уцепить некую часть от целевых параметров задачи (магию результата) -- типа жанра речи или грамматику или соотнесение смысла в разных языках - без интеллектуального усилия (типа того, что есть в профессиональной литературе), то есть практически даром. Другими словами, вам не надо 10-15 лет держать команду программистов и научных работников, чтобы создать переводчик с пяти языков. Сегодня, вам достаточно иметь массивы соотнесённых текстов на разных языках, удачную модель и несколько дней времени суперкомпьютера, чтобы получить универсальный переводчик с 95% годностью для практически любого количества языков. Да он будет неприлично большого размера, неэффективен, но будет решать вам эту задачу не хуже классического профессионального программного продукта, а магию результата вы получите совокупно в тысячи и десятки тысяч раз дешевле и быстрее классического варианта.
А дальше лишь вопрос к вашим спецам как они "вычленят" в заёмной модели "магию" повторной разметки, жанры речи, грамматику и всё остальное. Или напишут вам новую модель под вашу задачу на вашем наборе данных, потому что сделать такое на заёмной модели это, возможно, из категории как обучить слепого или дальтоника правильной "цветовой дифференциации штанов" - и для слепого потенциально возможно, но только по косвенным признакам с соответствующей же точностью.
понял, что пытался сказать, но не сформулировал в предыдущем комменте. Нынешний новый подход, позволяет решить как минимум некоторые задачи, не обращаясь к профессиональной литературе и прочей книжной и теоретической зауми.
То есть "пройти между капель дождя", не заморачиваться на вот этот научный анализ, метамодели и "научные" же методы искусственного интеллекта, обойтись получением вменяемого результата через "обычный" перебор, пошаговую интерполяцию или подгонку результата. Инженерный подход чисто в штатовском стиле.
Если решение можно легко и просто проверить - то хорошо. А если нельзя - то у вы или должны воспринять его на веру, или выкинуть нафиг и самому перекопать гигабайты литературы.
Абсолютное большинство больших языковых моделей это китайские комнаты. То есть что всосали на этапе обучения, тем и оперируют. То есть у них нет возможности выйти в инет пройтись по ссылкам, собрать цитаты. Они их генерируют, причём не всегда даже воспроизводя оригинальный вариант, потому что он в ней хранится в виде некоей вероятностной комбинации, то есть как минимум округлён.
Если у вас сетка, работающая как референт с доступом в инет или к архиву, то тут вам подадут результат и набор данных к нему приводящий, отнюдь не гигабайтный. И все источники будут проверяемые. Что не защищает от мусора, но от бреда точно. __________ Штатовские ИИ делаются замкнутыми в контексте того, что такие варианты можно почистить от лишней информации, скрытно отцензурировать, что актуально для Страны Лгунов, где даже ИИ не должен путать правильную картину мира.
Если вы делаете свой ИИ, то вы сами отвечаете за то где и каким образом он будет получать информацию: сам в себе или извне. То есть в первом случае тексты постановлений и высказываний будут генерироваться, во втором скорее цитироваться с указанием оригинального и проверяемого источника.
вам не надо 10-15 лет держать команду программистов и научных работников, чтобы создать - вот это-то и глупо! Какой же смысл сокращать интеллектуальные усилия в обществе, а не наращивать их, когда наконец-то, впервые в истории человечества, людям в нашей части света не грозит голод и непосильный физический труд?
Инженерный подход - да, понимаю, Но инженер - человек серьёзный, он сто раз проверит и перепроверит надёжность и повторяемость, да и тупых решений, полученных только методом тыка, не допустит - просто из уважения к предмету. Зачем программисту-инженеру уподоблять свою работу надуванию мыльного пузыря?
Да, каждому хочется побыстрее и полегче. Но это же не общий принцип жизни, мы же когда пирожное едим не стараемся его сожрать в один присест и на прогулке не двигаемся скорей-скорей. Ну не хочется работать над текстами - не надо, но какой смысл поручать машине читать хорошее и интересное, а не заниматься этим самим? Вот зачем студенту собранный чатом реферат? Он потом что будет делать с этими недополученными и неприсвоенными знаниями? ...Вот у меня подруга, выйдя на пенсию, собирается розочки на даче сажать. И гоняет сейчас "ИИ" в поисках "правильных решений". Вот тут да, тут этот чат годится, если он предложит розы поливать соляной кислотой, она ему не поверит, а если он что полезное найдёт, то и хорошо.
"Какой же смысл сокращать интеллектуальные усилия в обществе" это капитализм, тут балансиром является прибыль. Какой смысл сокращать качество, гнать дешёвые и полуодноразовые вещи, зачем делать их не ремонтопригодными? А всё очень просто. Это в коротком периоде повышает прибыль, а цикл общественной памяти ли бизнеса позволяет через год-два-пять всё повторить. То же и про интеллектуальные усилия. При отсутствии конкуренции они не нужны, потому что повышают затраты.
Я говорил про штатовский инженерный подход. Это немного другое в моём понимании. В своё время повеселила история, как Эдисон делал свою лампочку. То есть как мы дошли до жизни такой. Так вот там ту же нить накаливания изобретали в десятках вариантов, вплоть до того, что она делалась угольной на хлопковой основе, которая потом выжигалась. То есть лабораторные инженеры тыкались во все стороны, находя более оптимальные варианты перебором чуть ли не тысяч комбинаций и способов. Это тоже подход и он на практике работает, потому что позволяет выиграть главный ресурс - время - в конкурентной борьбе.
роль государства надо просто артикулировать иначе, капитализм как раз очень нуждается в регуляциях (что хорошо видно по США), а российские либералы, это догматично отрицающие, просто клинические идиоты, но к сожалению именно они задали направление движения и правила игры в 90-е.
ничем он не занимается. вы находитесь в рамках конечной статистической машины https://e2k-4d-x-ussr.livejournal.com/2300543.html, которая вам в рамках своей модели и набора данных производит интерполяцию по вашему запросу причём практически не выходя за рамки исходного статистического пространства, заданного набором данных.
То есть, если вы взяли писалово перестроечных либералов, блохеров, воспитанных и идеологически заправленных в 90-е, то получите как результат интерполяций "бред осмысленный ... на уровне неглупого студента-бездельника, начитанного молодого человека, который прекрасно понимает, что нужно рассказывать про литературу в сталинские годы" в рамках либероидного дискурса. То есть ЧатГПТ дал всё это усреднение перестроечной либерды и интеллехтуалов со светлыми лицами, потому что ничего другого у него в картине данных не было.
Ну а для вашей "ИИ (алгоритм предобучен на русскоязычных больших корпусах и дообучен на корпусе текстов наших испытуемых)" результат показывает, что дообучен алгоритм херово, и ваших спецов "пред/до-обучальщиков" как постановщиков задачи и специалистов надо где-то списывать в утиль или немного и больно бить, если всё же нужен результат.
Reply
Эх, Вашими устами... Да, хорошо бы большие языковые модели появлялись бы в результате машобучения на хорошо составленных корпусах. И любой чат-бот, бегающий по запросам пользователя, приносил бы результаты только из источников, заслуживающих доверия и лишённых тенденциозности. И хорошо бы, чтобы в машобучении было принято проводить повторную разметку объектов (текстов), а не ориентироваться только на F-меру. И здорово было бы в задачах автоматического анализа текста и текстопорождения использовать представления о жанрах речи и достижения функциональной грамматики. И т.д. и т.п. Тогда это всё и можно было бы считать методами ИИ - как о них говорится в профессиональной литературе https://www.litres.ru/book/gennadiy-osipov/metody-iskusstvennogo-intellekta-16958847/
Reply
изюминка текущих моделей ИИ заключается в том, что вот это метапрограммирование статистических моделей позволяет уцепить некую часть от целевых параметров задачи (магию результата) -- типа жанра речи или грамматику или соотнесение смысла в разных языках - без интеллектуального усилия (типа того, что есть в профессиональной литературе), то есть практически даром. Другими словами, вам не надо 10-15 лет держать команду программистов и научных работников, чтобы создать переводчик с пяти языков. Сегодня, вам достаточно иметь массивы соотнесённых текстов на разных языках, удачную модель и несколько дней времени суперкомпьютера, чтобы получить универсальный переводчик с 95% годностью для практически любого количества языков. Да он будет неприлично большого размера, неэффективен, но будет решать вам эту задачу не хуже классического профессионального программного продукта, а магию результата вы получите совокупно в тысячи и десятки тысяч раз дешевле и быстрее классического варианта.
А дальше лишь вопрос к вашим спецам как они "вычленят" в заёмной модели "магию" повторной разметки, жанры речи, грамматику и всё остальное. Или напишут вам новую модель под вашу задачу на вашем наборе данных, потому что сделать такое на заёмной модели это, возможно, из категории как обучить слепого или дальтоника правильной "цветовой дифференциации штанов" - и для слепого потенциально возможно, но только по косвенным признакам с соответствующей же точностью.
Reply
То есть "пройти между капель дождя", не заморачиваться на вот этот научный анализ, метамодели и "научные" же методы искусственного интеллекта, обойтись получением вменяемого результата через "обычный" перебор, пошаговую интерполяцию или подгонку результата. Инженерный подход чисто в штатовском стиле.
Reply
Получить результат, похожий на решение задачи.
Если решение можно легко и просто проверить - то хорошо.
А если нельзя - то у вы или должны воспринять его на веру, или выкинуть нафиг и самому перекопать гигабайты литературы.
Reply
Абсолютное большинство больших языковых моделей это китайские комнаты. То есть что всосали на этапе обучения, тем и оперируют. То есть у них нет возможности выйти в инет пройтись по ссылкам, собрать цитаты. Они их генерируют, причём не всегда даже воспроизводя оригинальный вариант, потому что он в ней хранится в виде некоей вероятностной комбинации, то есть как минимум округлён.
Если у вас сетка, работающая как референт с доступом в инет или к архиву, то тут вам подадут результат и набор данных к нему приводящий, отнюдь не гигабайтный. И все источники будут проверяемые. Что не защищает от мусора, но от бреда точно.
__________
Штатовские ИИ делаются замкнутыми в контексте того, что такие варианты можно почистить от лишней информации, скрытно отцензурировать, что актуально для Страны Лгунов, где даже ИИ не должен путать правильную картину мира.
Если вы делаете свой ИИ, то вы сами отвечаете за то где и каким образом он будет получать информацию: сам в себе или извне. То есть в первом случае тексты постановлений и высказываний будут генерироваться, во втором скорее цитироваться с указанием оригинального и проверяемого источника.
Reply
вам не надо 10-15 лет держать команду программистов и научных работников, чтобы создать - вот это-то и глупо! Какой же смысл сокращать интеллектуальные усилия в обществе, а не наращивать их, когда наконец-то, впервые в истории человечества, людям в нашей части света не грозит голод и непосильный физический труд?
Инженерный подход - да, понимаю, Но инженер - человек серьёзный, он сто раз проверит и перепроверит надёжность и повторяемость, да и тупых решений, полученных только методом тыка, не допустит - просто из уважения к предмету. Зачем программисту-инженеру уподоблять свою работу надуванию мыльного пузыря?
Да, каждому хочется побыстрее и полегче. Но это же не общий принцип жизни, мы же когда пирожное едим не стараемся его сожрать в один присест и на прогулке не двигаемся скорей-скорей. Ну не хочется работать над текстами - не надо, но какой смысл поручать машине читать хорошее и интересное, а не заниматься этим самим? Вот зачем студенту собранный чатом реферат? Он потом что будет делать с этими недополученными и неприсвоенными знаниями? ...Вот у меня подруга, выйдя на пенсию, собирается розочки на даче сажать. И гоняет сейчас "ИИ" в поисках "правильных решений". Вот тут да, тут этот чат годится, если он предложит розы поливать соляной кислотой, она ему не поверит, а если он что полезное найдёт, то и хорошо.
Reply
это капитализм, тут балансиром является прибыль. Какой смысл сокращать качество, гнать дешёвые и полуодноразовые вещи, зачем делать их не ремонтопригодными? А всё очень просто. Это в коротком периоде повышает прибыль, а цикл общественной памяти ли бизнеса позволяет через год-два-пять всё повторить. То же и про интеллектуальные усилия. При отсутствии конкуренции они не нужны, потому что повышают затраты.
Я говорил про штатовский инженерный подход. Это немного другое в моём понимании. В своё время повеселила история, как Эдисон делал свою лампочку. То есть как мы дошли до жизни такой. Так вот там ту же нить накаливания изобретали в десятках вариантов, вплоть до того, что она делалась угольной на хлопковой основе, которая потом выжигалась. То есть лабораторные инженеры тыкались во все стороны, находя более оптимальные варианты перебором чуть ли не тысяч комбинаций и способов.
Это тоже подход и он на практике работает, потому что позволяет выиграть главный ресурс - время - в конкурентной борьбе.
Reply
как-то невесело это всё... За разъяснения и примеры спасибо!
Reply
роль государства надо просто артикулировать иначе, капитализм как раз очень нуждается в регуляциях (что хорошо видно по США), а российские либералы, это догматично отрицающие, просто клинические идиоты, но к сожалению именно они задали направление движения и правила игры в 90-е.
Reply
Leave a comment