Книжка Педро Домингоса стала знаменитой донельзя. Сразу после выхода на неё обратили Билл Гейтс, Си Цзинпин и прочие умные люди. А более обыкновенные обратили внимание позже. Ибо с момента выхода в 2015-м году до сегодняшнего дня взаимодействие с ИИ затронуло почти каждого.
Я тут, в ЖЖ, рассказывал, как получал ветеранское. Люди в МФЦ способны помочь лишь загрузкой ваших данных в комп. Так это я и сам могу, удалённо. А что положено и чего не положено по закону - решает машинка. Это тревожно, но ладно. А вот с учёным Александром Цветковым из посёлка Борка получилось неладно. История довольно известная: система распознавания лиц перепутала его с маньяком-грабителем и человек почти год отбыл в СИЗО под следствием. Засим разобрались, но…
Собственно, в книге тож сказано очень многое, если читать внимательно. В начале представлена суть: Сегодня люди, которые не занимаются машинным обучением, не имеют даже общего представления о том, что делают обучающиеся алгоритмы». А ближе к финалу автор пишет, мол, скоро почти никому не надо будет работать, всюду настанет вменённый доход и благолепие. Но отражая текущую ситуацию, говорит правильно: «Сами того не осознавая, вы ежечасно делаете намного больше работы, чем могли бы без помощи машинного обучения». - Это именно так: все мы стали работать больше. И причина - в компьютерах.
Или ещё: Алгоритм Amazon лучше, чем любой человек, умеет определять, какие книги читают сегодня в мире». - не-а. Не «определять», а «формировать круг чтения». Со всеми вытекающими:(((.
Паки: «Товары на полках расположены согласно указаниям алгоритмов с обучением: именно они решают, какие товары лучше заказать, что поставить в конце ряда и где место сальсе - в отделе соусов или рядом с чипсами тортильяс». - да, это так. ИИ заставляет нас приспосабливаться к его нечеловеческим решениям. Хотя делает вид, что приспосабливается к нашим. Почти все, наверное, обратили внимание, сколь невменяемой, контринтуитивной и антилюдской стала система маркировки документов на работе.
Но ОК. Прогресс есть прогресс, мы от него никуда не денемся. Домингос описывает, откуда ноги растут, так сказать. Они растут сильно издалека, от фундаментальных подходов европейских мыслителей: «Рационалисты считают, что чувства обманчивы и единственный верный путь к знанию - логическое рассуждение. Эмпирики уверены, что рассуждения подвержены ошибкам и знание должно быть получено из наблюдений и экспериментов. Французы - рационалисты. Англосаксы (как их называют французы) - эмпирики. Мыслители, юристы и математики - рационалисты. Журналисты, врачи и ученые - эмпирики. «Она написала убийство» - рационалистический криминальный телесериал. «C.S.I.: Место преступления» - эмпирический. В мире информатики теоретики и инженеры знаний - рационалисты. Хакеры и специалисты по машинному обучению - эмпирики.
Рационалисты любят планировать все заранее, еще до того, как сделают первый шаг. Эмпирики предпочитают пробовать и смотреть, что получится. Не знаю, существует ли ген рационализма или эмпиризма, но, глядя на моих коллег-информатиков, я пришел к выводу, что это почти черты характера: некоторые рационалистичны до мозга костей и не могут быть другими, а другие - насквозь эмпирики и всегда такими были… «Рационализм или эмпиризм?» - любимый вопрос философов. Платон был ранним рационалистом, а Аристотель - ранним эмпириком. Но по-настоящему дебаты разгорелись в эпоху Просвещения, когда по каждую сторону встали по три великих мыслителя: Декарт, Спиноза и Лейбниц были ведущими рационалистами; Локк, Беркли и Юм - их соперниками-эмпириками…».
Отсюда возникает разница в практических подходах к созданию универсального ИИ: «Представления - формальный язык, на котором алгоритм машинного обучения выражает свои модели. Формальный язык символистов - логика, частные случаи которой - правила и деревья решений. Для коннекционистов это нейронные сети. Для эволюционистов - генетические программы, включая системы классификации. Для байесовцев - графические модели, общий термин для байесовских и марковских сетей. Для аналогизаторов - частные случаи, возможно, с весами, как в методе опорных векторов». - Более подробно о различных фундаментальных направлениях (или «племенах программистов») можно прочитать, например, тут:
https://habr.com/ru/articles/437684/. Ну, или много где: книжка-то вправду популярная, о ней пишут. А почему существует такое множество несводимых вариантов формировании ИИ, так тоже понятно: «Компьютеры - высшее проявление синдрома саванта: они без малейших проблем запоминают все, но хотим мы от них не этого».
Вот. Из приведённых отрывочков можно в целом понять стиль. И разобраться, чем книжка является и чем не является. И на что похожа и не похожа. Почти не похожа она на «Код» Чарльза Петцольда, хотя отсылки к его книге есть: «Хотите верьте, хотите нет, любой алгоритм, как бы сложен он ни был, сводится всего к трем операциям: И, ИЛИ и НЕ». Но прочтя «Код», можно было спокойно идти, например, в колледж для дальнейшего обучения. Книга давала неплохой фундамент. «Верховный алгоритм», скорее, описывает проблемы и предлагает пути решения. Только на ооочень дальную перспективу и аллегорично. Тут явный аналог - Дуглас Хофштадтер с книгой «Гёдель, Эшер, Бах…». Собственно, Домингос это не скрывает ни на уровне прямых отсылок, ни в плане стиля: «Есть ли что-то, на что неспособна аналогия? Нет, считает Даглас Хофштадтер…»; «Наш объединенный обучающийся алгоритм, наверное, лучше всего ввести с помощью аллегории». Хофштадтера в своё время чрезвычайно захвалили, но мне его манера объяснять сложное через ещё более сложное не глянулась никак. Книга Домингоса тож этим страдает, о чём писали в разных рецензиях, но всё ж не в такой степени.
Ну, и третий аналог «Алгоритма» это, конечно, «Чёрный лебедь» Нассима Талеба. Его Домингос, скорее, ругает, но сам пишет похоже: масса материала, масса верных частностей, а в глобальном плане - очень спорные прогнозы. Но сперва о добром.
Прямо бальзам на душу - появляющиеся к середине книги описания теоремы Байеса и Марковских сетей. Байсовское исчадие так и названо: «Теорема, которая правит миром». По работе мне, конечно, приходилось/приходится использовать разные статистические методы, но в реальной жизни помогают именно байесианский подход и марковские цепи. Хотя б на уровне прикидок, без абсолютно точных расчётов.
Такожде приятно, что автор ругает Ноама Хомского, кой для многих есть царь, бог и воинский начальник. И «инженерию знаний», как альтернативу машинному обучению тоже ругает.
Но теперь давайте о косяках. Почти всё, что касается, например, области знаний, куда причастен я (в самом широком смысле этой области) - неверно. Например: «В результате клетка похожа на крохотный компьютер, а ДНК - на действующую в нем программу: измените ДНК, и клетка кожи может стать нейроном, а мышиная клетка - превратиться в человеческую». - совсем не так. Вернее, мышиная клетка при замене ДНК станет человеческой, но вот внутри одного организма набор молекул ДНК идентичен во всех клетках. И в «клетках кожи» (их много типов) и в нейронах (их тоже много типов). Регуляция разная. О чём, кстати, автор говорит. Но вскользь и неубедительно.
Каждый нейрон напоминает крохотное деревце с огромной корневой системой из дендритов и тонким волнистым стволом - аксоном. Мозг в целом похож на лес из миллиардов таких деревьев, однако лес этот необычный: ветви деревьев соединены в нем с корнями тысяч других деревьев (такие соединения называются синапсами), образуя колоссальное, невиданное хитросплетение. <…>
Эти джунгли потрескивают от электрических разрядов. Искры бегут по стволам и порождают в соседних деревьях еще больший сонм искр. Время от времени лес неистово вспыхивает, потом снова успокаивается. Когда человек шевелит пальцем на ноге, серии электрических разрядов - так называемых потенциалов действия - бегут вниз по спинному мозгу, пока не достигнут мышц пальца и не прикажут ему двигаться. Работа мозга похожа на симфонию таких электрических разрядов. Если бы можно было посмотреть изнутри на то, что происходит в тот момент, когда вы читаете эту страницу, сцена затмила бы самые оживленные мегаполисы из фантастических романов. Этот невероятно сложный узор нейронных искр в итоге порождает человеческое сознание. - И это неверно. Электрические синапсы в ЦНС млекопитающих составляют около 1 %. Остальное - химические взаимодействия. Их обеспечивают нейромедиаторы. То есть, химия, а не электричество.
Эукариоты (и мы в том числе) эволюционируют медленнее, чем прокариоты (например, бактерии). - вовсе нет. Бактерии стабильны по миллиону лет, а новые виды, например, паразитических червей появляются прям вот в периоде наблюдений.
Чуть более тонко: «Верховный алгоритм сумеет извлечь из данных вообще все знание - знание прошлого, настоящего и будущего. Изобретение этого алгоритма станет одним из величайших прорывов в истории науки. Оно ускорит прогресс буквально во всем, изменит мир так, как мы едва можем себе сегодня представить. Верховный алгоритм для машинного обучения - это нечто вроде стандартной модели в физике элементарных частиц и центральной догмы молекулярной биологии: единая теория, объясняющая все, что мы сегодня знаем, и закладывающая фундамент десятилетий или целых веков будущего прогресса. - В биологии центральная догма действительно центральна, но есть обходные пути, пока мало освоенные. Последовательность «ДНК-РНК-Белок» выполняется очень часто, но не всегда. Есть обратные транскриптазы, есть прионы: белки, модифицирующие белок прямым воздействием. В Стандартной модели, говорят, тоже существуют кармашки и обходные пути. Хотя тут я совсем профан. Не настолько профан, как в машинном обучении, но профан.
Если сделать миллион повторений по тысяче бросков монетки, практически наверняка хотя бы одно повторение даст все орлы - Нет. Вероятность выпадения 1000 орлов подряд не 1: 1 000 000, а на много-много порядков ниже.
И так далее. То есть, если обучать ИИ на неверных вводных (а как видим, часто они неверные) результат будет так себе. Увы, станет он от этого не менее печальным. Например: «Никто не знает, как написать программу вождения автомобиля, да никому это и не надо, потому что машина, оборудованная обучающимся алгоритмом, посмотрит на действия водителя и разберется сама. - Да. И это очень тревожный момент: как написать такую программу никто из людей уже не знает. А программы пишутся и про инциденты с беспилотными автомобилями мы читаем, как минимум, еженедельно.
Но и это ещё не всё. Странноватыми кажутся фундаментальные подходы: «Большинство экспертов были убеждены, что объединить логику и вероятности вообще невозможно. Перспективы создания Верховного алгоритма выглядели неважно, особенно потому, что существовавшие тогда эволюционистские и коннекционистские алгоритмы тоже не могли справиться с неполной информацией и множественными наборами данных.
К счастью, с тех пор мы продвинулись вперед на пути к решению проблемы, и сегодня Верховный алгоритм кажется намного ближе». Может, конечно, и ближе, но вернёмся к основам и самой сути. О предшественниках Домингос пишет подробно, с удовольствием. Например, указывает, сколь наивен был Лаплас, считавший, что «…разум, которому в каждый определенный момент были бы известны все силы, приводящие природу в движение, и положение всех тел, из которых она состоит, будь он также достаточно обширен, чтобы подвергнуть эти данные анализу, смог бы объять единым законом движение величайших тел Вселенной и мельчайшего атома; для такого разума ничего не было бы неясного и будущее существовало бы в его глазах точно так же, как прошлое.
Это забавно, поскольку Лаплас был отцом теории вероятностей, которая, как он полагал, представляла собой просто здравый смысл, сведенный к вычислениям».
ОК. Только сам автор чуть позже говорит: «Все знание - прошлое, настоящее и будущее - можно извлечь из данных с помощью одного универсального обучающегося алгоритма.
Я называю этот алгоритм Верховным. Если его создание оказалось бы возможным, это стало бы одним из величайших научных достижений за всю историю человечества. Более того, Верховный алгоритм - последнее, что нам придется изобрести, потому что, как только мы «спустим его с цепи», он сам изобретет вообще все, что только можно придумать». - абсолютно тот же подход, основанный на априорных эмпирических данных. Только Лаплас не знал статистики, ему простительно.
Ну, и ещё. Тоже фундаментальное. Нам предложен подход к решению всех проблем без участия сознания! Человеческого или искусственного. Так-то это хорошо: машины, не умеющие поставить собственной цели, войны не начнут. Но накосячить могут. А уж при попадании алгоритмов в руки хакеров или, скажем, террористов, может стать совсем весело. Конечно, автор предлагает несколько линий обороны. Первая - позаботиться о непопадании Верховного алгоритма в плохие руки. Ещё б научиться отличать плохие от хороших…
Но ладно. Как говорится, поживём - увидим. Роль ИИ будет расти. Вероятность косяков -тоже. В целом-то всё зависит от того, насколько далеко во времени продлится эмпирическая схема, описанная Домингосом: «Наука в своем развитии проходит через три этапа, которые можно назвать фазами Браге, Кеплера и Ньютона. В фазе Браге мы собираем много данных, как Тихо Браге, который ночь за ночью, год за годом кропотливо записывал положение планет. В фазе Кеплера мы подбираем к данным эмпирические законы: Кеплер это делал с движением планет. В фазе Ньютона мы открываем глубокие истины. Наука в значительной степени состоит из работы, подобной труду Браге и Кеплера, а ньютоновские проблески - редкость. Сегодня большие данные делают работу миллиардов Браге, а машинное обучение трудится, как миллионы Кеплеров. Если - будем надеяться - человечество еще ждут великие озарения, их с равной вероятностью могут породить и обучающиеся алгоритмы, и еще более занятые ученые будущего, и совместные усилия ученых и алгоритмов».
Кто скажет, будет ли устойчива такая последовательность при доминировании ИИ? Никто, думаю, не скажет…
#веснаестьвесна