"Вы помните ли то, что видели мы летом?
Мой ангел, помните ли вы
ту лошадь дохлую под ярким белым светом..."
(Шарль Бодлер, "Падаль")
А замечали вы, мой ангел, как агрессивные маркетологи IT-индустрии беззастенчиво крадут терминологию из других сфер, в которых они совершенно не разбираются? Более того, стащив чужой термин, они присваивают ему собственный смысл, зачастую вообще противоположный тому, что означало это слово ранее.
Что такое "социальная сеть" в оригинале? Это когда вы заболели - и позвонили своему родственнику-врачу, и он вам помог. Или когда вы с друзьями-футбольными фанатами собрались на матч, а потом врезали по пиву. То есть горизонтальные связи в обществе.
Ну а что такое F***book? Это когда человек связывается с централизованной машиной, и машина отправляет человеку ленту комбикорма, состоящую из постов знаменитостей и прочих завлекалочек. Завлекалочки специально вычислены так, чтобы давить на вашу дофаминовую кнопку и держать вас как можно дольше на связи с этим аппаратом машинного доения. Но чем больше вы потребляете машинного силоса в стойле Ф***бука, тем меньше вы общаетесь с родственниками или друзьями напрямую. Ваши разнообразные горизонтальные связи заменяются на одну вертикальную. Выходит, это антисоциальная сеть.
Надо ли точно так же объяснять, мой ангел, что цифровые "нейронные сети" космически далеки от настоящих нейронов? Пожалуй, не буду. Перейдём сразу к следующему краденому термину. Не просто нейросети, а "генеративные". Как красиво звучит, да? Будто они создают что-то новое. Будто бы эта чудесная машинка вот-вот решит множество задач и заменит множество профессий, а затем наступит "сингулярность" (ещё один краденый термин, который, как обычно, означает совершенно другое в оригинале).
Однако давайте взломаем эту словарную магию. Представьте, что некую возню с картинками назвали "дегенеративной". И совсем иное определение такому алгоритму видится. Это система, которая берёт множество нормальных фотографий - и искажает их, портит всё то, что там изображено. Как ребёнок, который склеивает коллаж из частей тел, вырезанных из журнала. Смотрите, у него получился человек с тремя ногами. И семь пальцев на руке. И вместо зрачков - дырки от ножниц.
Узнаёте? Именно такие бредовые картинки выдаёт вам Midjourney. Определение этого алгоритма как "дегенеративного" хорошо ещё и тем, что даёт отсылку к "дегенеративному искусству". Конец XIX века, зажравшимся эстетам надоела красивая и правильная классика, и маятник общественной шизы летит в другую сторону. Именно тогда в моду входят порождения больной психики: искажение пропорций и цвета, распад целого на части, ну и попросту - галлюцинации.
Алгоритмы типа Midjourney работают именно так. Если совсем по-простому говорить, это распознавательная нейросеть, запущенная в обратную сторону. По прямому назначению, она должна после обучения распознавать. Представьте, что вы долго читали иллюстрированные книжки про собак, а потом вышли на улицу и увидали там колли - в ответ на картинку у вас в голове сразу возникает название породы.
Теперь запустим ту же цепочку нейронных связей обратно, от выхода ко входу. Вы идёте по улице и мечтаете о собаке. Слово это крутится у вас в голове. И тут в сумерках на стене вы видите... ну да, собаку. К счастью, у вашего разума есть дополнительные механизмы для сверки глюков с реальностью. Разум подсказывает: собака не может сидеть на стене, да ещё с шестью ногами, да ещё зелёная - это просто пятно плесени.
А вот Midjourney делает наоборот: усиливает галлюцинацию, продолжая повторять "Да, чувак, ты видишь собаку, собаку, собаку...". И на картинке вместо начальной плесени случайных пикселей появляется что-то похожее на собаку. Конечно, будучи глюком, эта картинка будет содержать множество искажений. Глюки не отбрасывают теней, не отражаются в зеркалах. Их выдают пальцы, зрачки и неправильно пришитые пуговицы, как в "Солярисе". Они попросту уродливы, как коллажи из дурдома.
Отчего же дегенеративные алгоритмы столь популярны, отчего толстосумы в Давосе рассказывают, что это главный прорыв года? Во-первых, смотрите выше про "дегенеративное искусство" - его популярность имела свои предпосылки в обществе. То есть наше общество готово кушать такой дегенеративный продукт, ибо это общество уже в значительной степени состоит из наркоманов, для которых глюки - знакомое развлечение. Или мультфильмы про Масяню, что может быть уродливее? Но они смотрят и причмокивают.
И тут вдруг оказалось, что производить глюки легче и выгоднее, чем полезные нейросети. Впервые я написал про этот бизнес в 2015 году, пост назывался "
Косяк как искусство". За прошедшие восемь лет стало окончательно ясно, что применение ИИ для решения серьёзных практических задач сопряжено с множеством проблем и ограничений. Предсказать эпидемию, найти лекарство от рака, спасти Африку от голода - нет, не помогают здесь хвалёные недо-нейро-сети.
Другое дело, если запустить ИИ в сферу развлечений, где не важна точность, нет критических последствий косяка, и нет никакой ответственности - тут можно рубить бабки прямо сейчас. Ведь у многих людей почти вся жизнь проходит именно в такой
необязательной деятельности.
Заметьте, как быстро сориентировался Яндекс. Свой алгоритм YaGPT они воткнули в Алису со слоганом "Давай придумаем". То есть они сразу предупреждают, что результат будет выдумкой, глюком. Никто не отвечает за базар.
Отмазка очень ловкая - но она же показывает, на чём стухнет бизнес дегенеративных алгоритмов. Для выдумок не нужен навороченный сторонний сервис, который ещё и собирает твои персональные данные. Есть простые и проверенные временем технологии творчества. Вот что советовал 500 лет назад Леонардо да Винчи в "Трактате о живописи":
"Я не премину поместить среди этих наставлений новоизобретённый способ рассматривания; хоть он и может показаться ничтожным и почти что смехотворным, тем не менее он весьма полезен, чтобы побудить ум к разнообразным изобретениям. Это бывает, если ты рассматриваешь стены, запачканные разными пятнами, или камни из разной смеси. Если тебе нужно изобрести какую-нибудь местность, ты сможешь там увидеть подобие различных пейзажей, украшенных горами, реками, скалами, деревьями, обширными равнинами, долинами и холмами самым различным образом; кроме того, ты можешь там увидеть разные битвы, быстрые движения странных фигур, выражения лиц, одежды и бесконечно много таких вещей, которые ты сможешь свести к цельной и хорошей форме; с подобными стенами и смесями происходит то же самое, что и со звоном колокола, - в его ударах ты найдёшь любое имя или слово, какое ты себе вообразишь...
Но если эти пятна и дадут тебе выдумку, то всё же они не научат тебя закончить ни одной детали".
Если же вы считаете, что современные ИИ-алгоритмы стимулируют творчество лучше, чем леонардовы пятна на стене - попробуйте объяснить, почему это не помогло самому Яндексу. Почему они назвали свою машинку таким уродливым набором звуков - YaGPT? Очевидно, потому, что первая игрушка в этой сфере называлась ChatGPT. А если бы она называлась ChatBDSM, то сервис Яндекса предсказуемо назывался бы YaBDSM. Вот и весь креатив, на который способны дегенеративные недосети.
Поэтому, мой ангел, не читайте перед завтраком антисоциальных сетей. А если кто скажет вам опять про сингуглярность - спросите у него, чему равен интеграл от дельта-функции Дирака. И понаблюдайте за его лицом, это будет забавно.