О докторах и нейросетях

Sep 06, 2024 13:00


Есть такой(неплохой, в целом) автор, Кори Доктороу, прославился, в общем-и-целом, самим фактом существования себя и своего блога, посвящённого борьбе с технокапитализмом под названием плюралистик( https://pluralistic.net/ ).

Я периодически почитываю этот блог с целью зарядиться свежей порцией пролетарской ненависти к охуевшим технобро и нонешнему своду дикого капитализма, производимого нашим главным гегемоном, и, в основном, согласен и с посылом автора, и с подмечаемыми им причинами и последствиями этого самого технокапитализма и безудержной власти венчурного капитала и прайват эквити.

Но никто не идеален, и Кори тоже. На днях наткнулся у него на статью о нейросетях(я отказываюсь называть всё это дело ЭйАйем, никаким интеллектом в этом матричном перемножении миллиардов циферок и в помине не пахнет; не в большей степени чем в любом другом алгоритме обработки данных), и она вызвала у меня острое желание покричать на облако.

Основной посыл статьи - «не всё так однозначно», и нейросети это, в целом и общем, fair use, и нечего вам, артистам, на него бухтеть, тем более что ваш аргумент про copyright это навязанная вам корпорациями химера, которая вас только закабаляет.

И у меня к этой позиции есть много претензий, но в основном они сводятся к двум пунктам.



Первый, это, конечно же, аргумент про fair use и мол «никто не ворует ваши картинки», это мол просто репрезентация, такая же, как гугль показывает вам результаты поиска. Мол индексация дело неподсудное, ну а то, что внутри модели представляет вашу картинку это, внимание - математическая репрезентация собранных данных(After making transient copies of lots of works, the next step in AI training is to subject them to mathematical analysis.). И тут, чёрт с ним, с легалезом по поводу фейр юз, где тоже есть проблемы в логике, у Доктороу случается первый гигантский скачок в логике.

Любая картинка в интернете это, бай дефинишн «математическая репрезентация изображения». Ну просто исходя из того, что любой алгоритм компрессии это тот самый математический анализ пикселей, и свёртывание их последовательностей в ряды фурье для того, что бы показать вам где живут шакалы в джпеге. И сохранение «математического анализа» картинки это и есть, квайт литерали, «сохранение картинки». То, что ваш алгоритм компрессии работает максимально энергетически неэффективным образом, ещё и с большим количеством искажений, ничего в этом смысле не меняет. И единственное, что отличает его от просто джпег-компрессии, что «поиск» по этой базе данных довольно неточный by design и намеренно обфускированный миллиардом других картинок, сохранённых в этой же базе данных.

Танцы вокруг этого факта мало что меняют в основе происходящего: нейросетевые «модели» это базы данных всех, кхм, данных, в них загруженных, то есть это не просто «посмотрел на картинку», а «использовал чужую работу». Со всеми последствиями этого факта.

И вторая претензия, о копирайте. Аргумент Доктороу звучит, если совсем сжать и выплеснуть ребёнка по дороге, так: «копирайт придумали корпорации, значит вы должны быть против него, а не пытаться использовать его для вашей защиты [от охуевших технобро]».

И к этому аргументу у меня даже нет контрдоводов, кроме как шумно выдыхать и сокрушаться, что заслуженный боец против корпораций, выдумавший термин enshitification, внезапно решает, что один из немногих инструментов, который хоть и был задуман не для защиты «маленьких», но способен помочь в конкретно этой борьбе, это мол херня, дил виз ит, всё равно вам будет хуже: «This is the third nuance: even if we can craft a model-banning copyright system that doesn't catch a lot of dolphins in its tuna net, it could still make artists poorer off.»

И я нахожу эту позицию очень и очень вредной. Да, действительно, система копирайта сломана; да, она, как он верно указывает в примерах, она чаще оставляла горький привкус на устах, нежели чем большое количество наличности в карманах у артистов, но это всё, во-первых, selective bias, и многие(меньшинство, но больше чем статистическая погрешность) артисты(художники, музыканты, авторы игр и тд) вполне себе живут с роялей, которые им выплачиваются из-за системы копирайта, и без неё их bargaining power был бы существенно хуже. Но на основании того, что мол вот де раньше-то рекорд-лейблы артистов нагибали через систему копирайта, то и сейчас вам лучше её не использовать, а то как бы чего не вышло! Нетактично умалчивая, что других инструментов у артистов(в широком смысле: писатели, художники и тд) для хоть какого-нибудь сопротивления в рамках текущей системы просто нет. Ну а дожидаться новой системы, которая магически решит все проблемы - больше шансов на инопланетян или на голодную смерть.

В общем и целом не то, что бы я говорил что-то новое или экстраординарное, просто в основном я с Доктороу по куче вопросов согласен, и этот его довольно неожиданный тейк в защиту наших текбро-оверлордз заставил сильно поднять обе брови, и расстроиться, что и тут не обошлось без ущемления прав художников со стороны эстеблишмента, воюющего за всё хорошее против всего плохого.
Previous post Next post
Up