Для затравки: Какого Цвета ваши биты?

Aug 22, 2007 17:46


Давно и с разных сторон я подходил к целому кругу вопросов, связанных, так или иначе, с понятиями вроде "настоящести".

В эту группу я отношу: вопрос о соотношение оригинала и копии, а также о подделке в произведениях искусства; темы копирайта, авторства и плагиата; вопросы использования фонограммы; близкую многим участникам ЖЖ тему "кражи фотографий"; идею "интеллектуальной собственности", и прочие.

Лично на мой взгляд, то, что происходит в умах и речах большинства людей, с чьими высказываниями по данному вопросу я ознакомился (в основном, через Интернет), лучше всего описать как "семантический шум", а то и "семантическое мошенничество". Впрочем, ситуация тут мало отличается от споров по вопросам религии или "околонауки". После чтения некоторых милых книг (вроде произведений Роберта Антона Уилсона) кое-что стало для меня проясняться. Но после чтения Альфреда Кожибского (хватило всего лишь нескольких глав) картина перед моим разумом раскинулась просто кошмарная.

У меня создаётся впечатление, что множество людей поражено своего рода "ментальным СПИДом" - просто потому, что до сих пор отсутствует в широкой массе представление о "ментальной гигиене". Неумение различать уровни абстракции, отождествление слов с объектами, а объектов с событиями, плюс мощный эмоциональный заряд - всё это, видимо, блокирует для очень многих людей способность ясно и непротиворечиво мыслить. И в итоге мы, по-моему, во многом пребываем на уровне Средневековья, чему свидетельство - вышеупомянутый круг вопросов, а точнее, то, как это всё обсуждается.

Я хочу попробовать поговорить с теми, кому будет интересно, на эти темы. Вполне вероятно, что в своём восприятии я что-то упускаю, и придерживаюсь неконструктивных взглядов. Если так, то буду очень рад "залатать дыры". Общение я думаю построить так - я буду время от времени выкладывать тут свои размышления на данные темы, и надеюсь услышать комментарии, благо мои друзья кажутся мне людьми интересными, творческими, и совсем неглупыми )).

Всё это будет где-нибудь в начале осени, после того, как я вернусь с отдыха, а пока выложу одну интересную статью, найденную мной в Интернете на днях. Написал её некий Matthew Scala, оригинал здесь, а под катом я опубликую свой перевод с некоторыми сокращениями. Статья касается вопросов копирайта и постоянных попыток сделать так, чтоб "читать было можно, а копировать - хуй" )))



Matthew Scala, 2006
перевод ibsorath, 2007

КАКОГО ЦВЕТА ВАШИ БИТЫ?
Замечание: При переводе я опустил некоторые шутливые метафоры, позаимствованные автором из игры "Паранойя", и некоторые примеры - просто потому что лень ))) Думаю, на общем понимании это не скажется. - ibsorath

[пропущен абзац, в котором автор упоминает ролевую игру "паранойя" как основу своих метафор]

В областях, касающихся интеллектуальной собственности, нас очень интересует информация, данные, произведения искусства - целое множество вещей, которые я называю одним общим словом «биты». Биты - это всё, что вы можете (хотя бы принципиально) представить в виде двоичных нулей и единиц. А самая суть законов об интеллектуальной собственности сводится к правилам, касающимся неосязаемых атрибутов битов: Кто создал данные биты? Откуда они появились? Куда направляются? Не являются ли они копией других битов? Вероятно, на эти вопросы могли бы ответить "метаданные", но метаданные для меня означают просто ещё дополнительные биты, присоединённые к тем, о которых спрашивается, а я хочу подчеркнуть, что моя статья касается чего-то такого, что не может быть представлено битами, принципиально. Давайте назовём это «Цвет».

Биты не имеют природного Цвета. Цвет, в этом смысле слова, не является частью природы. Что ещё более важно, вы не имеете возможности посмотреть на биты, и увидеть, какого они Цвета. Недавно мне встретился замечательный пример «Цвета битов»: один из моих друзей рассказал, как он сграбил в mp3 знаменитую беззвучную композицию Джона Кейджа 4’33’’. А, спрашиваем, ты, наверное, забил нулями файл подходящей длины, а потом сжал его в mp3? Нет, нет, сказал он. Если бы я так поступил, это не было бы настоящей композицией 4’33’’, потому что, для исполнения данной композиции, вы должны соблюдать тишину определённым образом, согласно правилам, сформулированным композитором. Это не просто 4 минуты 33 секунды какой угодно тишины.

Мой друг воспользовался сложным процессом, который, в общих чертах, заключался в исполнении какого-то куска какой-то музыки в течение четырёх минут и 33 секунд на программном синтезаторе, при уровне звука, выставленном в ноль. Результатом был файл соответствующей длины, заполненный нулями - который он и сжал в mp3. Итоговый mp3-файл был побитовой идентичной копией того, который получился бы с помощью способа, о котором говорили мы... но этот файл был (как заявлял мой друг) законной записью 4’33’’, а другой - нет. Разница заключалась в Цвете битов. Он уверял, что биты в его копии 433.mp3 имели Цвет, отличный от Цвета битов файла 433.mp3, который я мог бы получить с помощью банальной процедуры заполнения файла нулями, даже если два файла состоят из совершенно одинаковых битов.

Так вот, предыдущий абзац - по большому счёту, полный нонсенс для специалиста-компьютерщика или для любого, имеющего математическое образование (мой друг тоже из таких; он проделал всё это в качестве своего рода замороченной шутки). Числа - это числа, верно? Если я сложу 39 и 3, и получу 42, а вы проделаете аналогичную операцию, то нельзя сказать, что «моё» 42 как-то отличается от «вашего» 42. Имея два побитно идентичных mp3-файла, нет осмысленного (с точки зрения учёных-компьютерщиков) способа сказать, что один из них - это запись композиции Кейджа, а другой - нет. Просто нет никакого способа протестировать один из файлов и сказать, который это из них, потому что они, на самом деле, представляют собой один и тот же файл. Побитовая идентичность - это, по определению, неразличимость, отсутствие какой-либо разницы. Биты не имеют Цвета; компьютерщики, как и компьютеры, слепы к Цвету. Это не наша ошибка или недостаток: скорее наоборот, мы много работали над тем, чтобы стать такими. Цветовая слепота компьютерщиков помогает им понимать тот факт, что компьютеры тоже слепы к Цвету, и нам нужно быть близко знакомыми с этим фактом, чтобы делать свою работу.

Проблема в том, что люди, вообще говоря, не все слепы к Цвету. Закон не слеп к Цвету. Значение имеет не только то, каковы данные биты, но и то, откуда они взялись. Есть очень интересная Веб-страница, иллюстрирующая Цветовую Природу битов с точки зрения закона, и находится она на сайте Военно-морской Обсерватории США. На этом сайте представлена информация о том, когда восходит и заходит Солнце, и тому подобное. Но она предоставляется с предупреждением, что эта информация не годится для использования в судебном разбирательстве. Если вам нужно знать, когда взошло или село Солнце, для использования в судебном процессе, то вам необходимо свидетельство эксперта - потому что вам на самом деле недостаточно просто иметь биты, говорящие о том, когда взошло Солнце. Вам нужно, чтобы эти биты были ПОКРАШЕНЫ, покрашены в тот Цвет, который позволит им быть убедительными в суде, а Обсерватория не может этого сделать. И это не просто вопрос точности - все мы прекрасно знаем, что числа, предоставляемые Обсерваторией, в порядке. Это вопрос происхождения чисел. Для юристов вполне имеет смысл то, что происхождение информации важно - на самом деле, может быть, даже более важно, чем сама информация. Закон видит Цвет.

Предположим, вы опубликовали статью, которая, оказывается, содержит предложение, идентичное одному предложению из данной статьи, например, «Закон видит Цвет». Это просто три слова, все они общеизвестны, и такое могло произойти просто случайным образом. Может быть, вы думали на сходные темы, и получилось так, что вы использовали слова похожим образом. Если так, прекрасно. Но если вдруг вы написали «свою» статью, вырезая и вставляя куски из «моей» - в этом случае, слова имеют Цвет, который обязывает вас следовать процедуре «цитирования», и беспокоиться о статусе «производного произведения» (derivative work), согласно закону о копирайте. В точности одни и те же слова - представляемые в компьютере одинаковыми битами - могут различаться Цветом, и приводить к разным последствиям. Если вы используете эти слова без обозначений цитирования, то вопрос о том, автор вы или плагиатор, зависит от того, откуда вы их взяли, даже если это - одни и те же слова. Важно то, откуда взялись биты.

Мне кажется, Цвет - именно та концепция, которую хотят подорвать разработчики системы Monolith, хотя, как мне кажется, их понимание данной темы поверхностно и с точки зрения закона, и с точки зрения науки. Идея Monolith заключается в том, чтобы математически скомбинировать два файла с помощью операции XOR («исключающее или»). Вы берёте файл, на который кто-то заявил свои авторские права, смешиваете его с файлом в свободном доступе. И вот результат: перемешанная куча битов, предположительно, не содержащая информации, предположительно и не подпадает под действие авторских прав, даже если кто-то другой может позже обратить процедуру смешивания, и получить копию исходного файла, защищённого авторским правом. О, благословенный день! Теперь все юристы должны убраться восвояси, потому что мы продемонстрировали абсурдность «интеллектуальной собственности»!

Слабость Monolith в быстрой и неосторожной игре с идеей Цвета. Имеет место попытка использовать юридические законы в один момент, и математические в другой, как общепринятые. Когда у вас есть файл с копирайтом, он, ясное дело, имеет Цвет «защищён авторским правом», и на вас распространяется соответствующий закон. После шифровки Monolith заявляют, что результирующий файл не имеет Цвета: как он может иметь Цвет копирайта? Это же просто случайные биты! Затем, когда мы его дешифруем, он по-прежнему не имеет Цвета копирайта, потому что он получился из смешивания бесцветных, свободно доступных ингредиентов. Проблема заключается в использовании здесь двух конфликтующих сводов правил. Согласно юридическим правилам, Цвет не является математической функцией битов, значение которой вы можете определить, исследуя биты. Важно то, откуда они взялись. Шифрованный файл по-прежнему имеет Цвет копирайта, потому что этот файл появился из защищённого копирайтом исходного файла. Абсолютно не важно, что он выглядит похоже, или даже является побитно совпадающим с другим файлом, который вы могли бы получить с помощью генератора случайных чисел. Вы ведь не получили его с помощью генератора случайных чисел. Вы получили его из защищённого авторскими правами материала; он защищён авторскими правами. Случайно сгенерированный файл, даже совпадающий с данным файлом бит в бит, был бы другого Цвета. Цвет наследуется через все операции шифровки-дешифровки, а вы распространяете защищённую авторским правом информацию.

Для компьютерщика, с другой стороны, биты - это биты - это биты, и абсолютно фундаментальным является то, что два идентичных отрезка битов неотличимы друг от друга. Цвета не существует. Я слышал утверждения компьютерщиков (один из них сказал такое буквально вчера, в беседе, вдохновившей этот пост), что законы копирайта неизбежно ведут к абсурдным выводам. Например: «Если у меня есть авторское право на что-то одно, и копирайт наследуется через процедуру “исключающего или”, то у меня есть авторские права на всё, что угодно. Потому что всё, что угодно, можно получить из того, что у меня есть, смешав с некоторым подходящим файлом с помощью “исключающего или”». Это звучит убедительно, только если вы слепой к Цвету компьютерщик; и будет скучной чепухой для юристов, потому что они научены верить в Цвет и использовать его. И для юриста очевидно, что Цвет не распространяется магически на всю вселенную через гипотетические случайные файлы, которые могут быть когда-то созданы. Вы могли бы создать файл случайно - но вы ведь не сделали так. Возможно, вы можете создать файл, идентичный полному собранию сочинений Шекспира, смешав с помощью XOR два файла с вроде бы случайным содержимым. "И я могу, и каждый это может", но это не значит, что я - Уильям Шекспир.

Идея Цвета представляет собой проблему в общении между теми из нас, кто работает в мире компьютеров, где Цвет не существует, и теми, кто работает в юридическом мире, где Цвет существует и играет важную роль. Юристы спросят компьютерщика, как определить Цвет битов, и компьютерщику будет трудно сказать в ответ что-либо, что удовлетворило бы юриста - потому что важной частью компьютерной грамотности является понимание того, что Цвет не существует. Всякий, кто очень заинтересован в том, какого Цвета биты, и тратит уйму ресурсов в попытках ответить на такой вопрос - опасный идиот. А в концепции «интеллектуальной собственности» Цвет битов существует, и имеет крайнюю, первостепенную важность. Компьютерщик, не желающий отвечать, какого Цвета данные биты, оказывается совершенно бесполезен, а компьютерщик, отрицающий само существование Цвета (как и должен бы поступать любой учёный в этой области) - опасный идиот.

Есть несколько способов, которыми мы можем попытаться избежать подобного. Компьютерщики, которые хотят быть полезными, могут сказать: «Ну ладно, юристы, вы опасные идиоты, но я должен работать с вами, иначе меня бросят в тюрьму, как это случилось с Дмитрием Скляровым. Так что я попытаюсь удовлетворить ваши требования. Вы говорите, что у неких битов есть некое особое свойство, и мы должны знать, какие биты имеют это свойство. Ясненько. Мы присоединим к файлам нужные тэги, которые будут говорить, какого они Цвета». В области копирайта это - способ «rights management information”. Это то, что было сделано с DVD (региональная кодировка), видеокассетами (Macrovision), электронными книгами Adobee («вы не можете читать этот файл вслух»), CD (SCCM), и множеством других форматов. Проблема в том, что если мы (как учёные-компьютерщики) интеллектуально честны, то должны признать, что на самом деле всё это не работает.

Тэги - это просто ещё биты. Вы можете написать тэг, который будет говорить «это Оранжевый тэг», но он будет сделан из битов, и поэтому на самом деле не будет иметь Цвета - потому что Цвет не существует. Это будет просто бес-Цветный тэг, говорящий «это Оранжевый тэг». И к нему приложимы все последствия того факта, что Цвет не существует - так же, как и тот факт, что этот тэг может быть просто вырезан позже. Компьютерщики это понимают; мы просто не можем иначе, потому что нас делает компьютерщиками в первую очередь наше знание о несуществовании Цвета.

То, чем мы занимаемся в системах Rights management information - это симуляция Цвета компьютерным способом. Но юристы могут впечатлиться возможностью такой симуляции, и сказать: «Видите! Вы согласились! Вы всё-таки можете распознать Цвет битов!», и в результате заключить, что все остальные правила, которые они придумывают, являются осмысленными с точки зрения компьютерных наук. Они скажут именно: «Вы всё-таки можете распознать цвет!», вместо: «Всё-таки, Цвет существует!» - потому, что сама идея несуществования Цвета вообще находится за пределами их воображения. Тот «факт», что Цвет есть нечто реальное, настолько фундаментален для юридического закона, что его даже не ставят под сомнение. «Конечно же, Цвет существует. Мы, юристы, думаем о Цвете так много, что мы думаем, что видим его. Почему не видите вы? Ну, может быть, у вас что-то не в порядке с глазами». Как учёные-компьютерщики, мы должны ясно сказать, что Цвет, симулируемый бесцветными тэгами типа «это Оранжевый тэг», это по-прежнему всего лишь симуляция. Свойства, которые Цвет должен иметь, не обеспечиваются автоматически тэгами, потому что это - свойства Цвета, тэги - это биты, а у битов нет Цвета. Даже биты, говорящие о Цвете, сами по себе бесцветны. Нет такой вещи, как Цвет.

Ещё один способ, который могут испробовать компьютерщики - это рассмотреть Цвет как функцию (в строгом математическом смысле этого слова) данных битов. Возможно, это будет невычислимая функция (в строгом математическом смысле), возможно, трудноопределимая, но, тем не менее, функция. Мы можем сделать это, например, потому, что ошибочно верим, что Цвет - на самом деле функция. Либо, если мы не так просты, и знаем, что Цвет - это не функция, мы можем всё-таки думать, что можно изобразить его с помощью функции достаточно точно для того, чтобы юристы от нас отстали. В любом случае, идея состоит в том, что мы должны иметь возможность посмотреть на биты, и как-либо определить, исходя из битов самих по себе, какого Цвета они должны быть.

Рассматривать Цвет как функцию - почти то же самое, что присоединять тэги к битам - разница в том, что, если Цвет это функция битов, то мы можем не беспокоиться о том, что тэги кто-то удалит. С другой стороны, если Цвет - это функция битов, то мы никогда не можем сопоставить с данной конкретной последовательностью битов более, чем один конкретный Цвет. Monolith зависит от использования данной проблемы: предполагаем, что один файл может иметь только один Цвет, и заключаем, что Цвет выходного файла будет «можете копировать», на основе (корректного) утверждения, что закрепление любого другого единственного и неизменяемого цвета приведёт к юридическим проблемам. А отсюда логически следует утверждение, что так можно произвести без нарушения закона то, что иначе было бы нарушением закона об авторских правах. «Один Цвет для файла» - это не юридическое правило, а просто следствие подхода «Цвет есть функция», и рассмотрение Цвета только как функции - просто то, к чему склоняются компьютерщики, потому что функции имеют смысл в свете нашего образования, а Цвет - нет. На самом деле, Цвет - вообще не функция.

Попытки вытащить Цвет из битов могут казаться осмысленными до тех пор, пока биты связаны с физическими объектами. Вы можете исследовать бумажный документ и определить, оригинал это, или фотокопия. Вы, вероятно, можете исследовать некую фотографию и определить, это фотография реальной сцены, или что-то более сложное. Но даже в аналоговом случае, определение Цвета с помощью исследования не всегда возможно. Вы не можете определить, глядя на фотографию двух реальных людей, занимающихся сексом, занимались ли они этим добровольно, не говоря уже о том, давали ли они согласие на фотографию. Это Цветовое различие, которое не есть функция битов, составляющих фотографию - и это верно даже для аналоговых фотографий.

Ещё важные вопросы, на которые вы можете или не можете ответить, исследуя фотографии, это: «Вот это на самом деле люди, или некая симуляция?» и «Сколько им лет?». Эти вопросы могут быть трудными в аналоговом случае, и становятся ещё труднее в цифровом. Легко вообразить, как кто-то может без всякой задней мысли случайно получить (рисуя, или с помощью ray tracing, или как угодно ещё) изображение, побитно совпадающее с изображением, имеющим Цвет (предположим, Розовый), соответствующий нелегальной детской порнографии. В этом случае, в зависимости от вашей точки зрения, может иметь значение, откуда эти биты взялись, для определения того, они Розовые (нелегальные) или Зелёные (легальные). Идентичные биты могут иметь разные Цвета.

Детская порнография - это интересный случай, потому что и я, и, вероятно, многие в компьютерном сообществе находятся на необычной для них стороне пропасти между Цветом и Слепотой. В случае копирайта я много времени уделил объяснению, почему Цвет не существует, и, следовательно, неважно, откуда взялись биты. Но когда дело касается детской порнографии, я думаю, может быть, Цвет мог бы создавать различие - просто, если мы вообще хотим её запретить, то тогда имело бы значение, откуда она берётся. Были ли вовлечены настоящие дети, давали или нет согласие, короче говоря: какого Цвета биты. Другая сторона занимает противоположную позицию: детская порнография опасна сама по себе, самим фактом существования, и не важно, откуда она взялась. Они утверждают, что являются или нет некие биты детской порнографией (и если так, нелегальны они или нет), должно целиком определяться (являться функцией) битов самих по себе. Легальность, по крайней мере, по закону о непристойностях (obscenity law), не должна включать Цветовых различий.

Думаю, компьютерщики могли бы действительно намного лучше понимать Цвет, чем сейчас, потому что в компьютерных науках есть области, где Цвет играет роль. Я уже упоминал идею цитирования и плагиата - идентичные слова можно или нельзя использовать без символов цитирования в академической литературе, в зависимости от их Цвета. Те из нас, кто получил учёную степень, могут следовать таким правилам потому, что те, кто так не делают, вышвыриваются из учебного заведения до защиты. Вот это общее академическое приложение Цвета.

[далее автор приводит ещё пару примеров, по-моему, не особо относящихся к делу]

шумысли, антикопирайт, litorture

Previous post Next post
Up