Об обучении ИИ

Nov 15, 2024 10:22

Надысь, то есть прямо вчерась обсуждалась тема ИИшечки, как слепка с нашего общественного коллективного сознательного и бессознательного.

И по результатам последующей рефлексии у меня сложилась более детальная картина источников этого слепка.

Мысль примерно такая. В общем-то люди в основой своей массе достаточно приличны и склонны вести себя нормально. Но это самое большинство фактически не представлено в виде культурных артефактов, которые могут стать основой обучающих выборок для ИИшечки. Что продуцирует обычный среднестатистический обыватель? Да ничего! Большая часть людей являются лишь строчками различных реестров типа ЗАГСов, зарплатных ведомостей, военкоматов и так далее.

Даже с появлением интернета и соцсетей, люди всё равно мало пишут, мало постят картинок своего авторства, мало создают музыки и подкастов.

Я, к примеру, являюсь явным исключением со своим ЖЖ в котором уже 1000+ текстов, а так же дисером, несколькими статьями и условными пятью видосиками, где я что-то рассказываю.

Большая часть людей даже таким мизером похвастаться не может.

Тогда на чём же обучают ИИшечки? Ответ прост и лежит на поверхности и корни его лежат в ответе на вопрос, а что же всё-таки есть культура - агитация и пропаганда или средство самовыражения?

На самом деле, разумеется, и то и другое. Но вот представленность и широта распространения различных видов культуры разительно отличаются. И распределяются в лучшем случае примерно, как и упомянутые источники контента: большая часть контента - это джинса, сделанная по заказу, с целью агитации и пропаганды, и лишь малая часть - это средство самовыражения и творческой самореализации.

С учётом того, что агитация и пропаганда в общественных формах структурного насилия имеет целью агитировать за структурное насилие и пропагандировать его пользу, то ИИшечка соответственно и обучается в основном именно на этих материалах.

Напомню, что общественные формы структурного насилия лучше всего иллюстрируются организационной структурой под названием концлагерь. Соответственно, ИИшечка, если говорить по простому, обучается в основном на апологетике тюремной романтики, то есть уставах караульной службы и блатных понятиях.

В результате, мы получаем ИИшечку с напрочь скособоченной "психикой", которая по сути даже не отражает реальную картину психологии человечества. Это примерно, как если бы мы обучали её на основе данных по больнице, а потом бы удивлялись, что она знает о нас то, что все люди очень сильно больны, что, очевидно, крайне далеко от реального положения дел.

Ещё один прекрасный пример можно привести на основе актуалочки. Если обучать ИИшечку на основе ныне доминирующего в публичном пространстве Запада дискурса в виде гендерной повесточки, то ИИшечка будет считать, что быть гетеросексуалом - это редкое отклонение среди разнообразных гендерных единорогов, которые являются доминирующими. Что, разумеется, крайне далеко от истины, как вы понимаете сами. Просто гендерная повесточка генерирует совершенно дикое количество культурных артефактов, непропорциональных её реальной значимости в жизни человечества.

И таких перекосов море. Таким образом, можно констатировать, что обучение больших языковых моделей сейчас - это совершенно бесполезное занятие, так как для них нет адекватных выборок, которые были бы полезны для человечества в целом. И вся эта трата ресурсов по сути израсходована практически зря, потому что эти модели нужно сносить и создавать новые - чистые и здоровые. Но это будет потом, когда в наличии будет здоровое общество и здоровые обучающие выборки.

В этой ситуации радует только одно - понятно, что сильный ИИ, о котором так бойко говорили убогие футурологи не случился. ИИ таки оказался просто способом агрегации и получения доступа к разнородной информации большого объёма. И решения на его основе займут своё место в качестве вспомогательных инструментов различного назначения. Увы, военного тоже, но это не хотя бы не будет Скайнет.

ИКТ, ИИ, политика, политинформация

Previous post Next post
Up