Целеполагание, машинное обучение, когнитивные операции Пиаже

Dec 31, 2017 14:59


Пока писал вот этот коммент (он же краткая версия:)), подумал любопытную, может быть, мысль. Сейчас на волне успехов машинного обучения иногда рассуждают о реализованной в машинах мотивации в терминах свободы воли: мол, тот кто ставит задачи, тот и есть субъект. Высказывается мысль, что пока целевая функция, используемая при обучении, контролируется человеком, ни о каком субъекте (что бы это ни значило) экс машина можно не мечтать.

Но штука в том, что это могут быть функции не только от входных и выходных данных, а от любых сколь угодно сложных и как угодно сформулированных характеристик внутреннего состояния системы. А это значит, что задачи, которые, грубо говоря, решает машина (по крайней мере, промежуточные), могут зависеть от ее внутреннего состояния, т е она ставит их "как бы сама".



Рассмотрим систему вроде игрового агента. Она получает на вход игровую ситуацию, принимает решение (делает ход) и получает новую игровую ситуацию, которая зависит как от сделанного хода, так и от внешних неконтролируемых факторов (например, хода противника). Для игровой ситуации определена функция полезности, которую система стремится максимизировать. В такой системе имеет смысл прогноз ситуации при том или ином принятом системой решении, т е система может быть реализована так, что, учась решать свою основную задачу максимизации игрового счета, она будет (в качестве подзадачи) учиться минимизировать ошибку прогноза. "Желание" системы уметь угадывать будущее можно интерпретировать как некую мета-потребность, следование которой в целом благоприятствует максимизации основной целевой функции. Антропоморфно-психологически можно интерпретировать эту мета-потребность как "жажду компетентности", "жажду контроля". Например, играя сама с собой в шахматы или Го ради того, чтобы потом с большей вероятностью выиграть у противоника, система, если говорить в этих терминах, удовлетворяет свою мета-потребность.

Но таких мета-потребностей сформулировано довольно много. Например, при обучении можно симулировать:

- противоположность жажде компетентности - потребность в новизне, в том, чтобы получать сенсорный вход, при текущем состоянии системы не дающий надежных прогнозов ("жажда новых впечатлений, тяга к непонятному").

- желание снижать размерность описания - потребность строить прогнозы, используя минимум переменных. Часто такая штука жестко заложена в структуре системы в виде той ли иной процедуры факторного анализа, или, как в виде ограничения количества элементов скрытых слоев сети, но более общий (и, конечно, более медленный) способ добиться того же эффекта - это стимулировать его в ходе обучения.

- желание переносить опыт, полученный на одних данных, на другое. Опять же, в популярных ныне конволюционых сетях это реализовано как процедура, но это частное решение в принципе можно обобщить до более унверсального, где подобная стратегия стимулировалась бы в процессе обучения.

- и далее прямо по (окей Гугл)"Психологии интеллекта" Пиаже, где он разбирает стратегии, придающие тому неясному, что мы называем интеллектом, свойство универсального решателя произвольных задач (ну или, во всяком случае,  униварсального отыскивателя произвольных закономернстей). Кстати, стратегии эти, как мне на беглый взгляд кажется, могут быть довольно естественным образом формализованы. Впрочем, на этот предмет надо бы Пиаже перечитать..

Интересно то, что группы операций, выделенные Пиаже, обладают (должны бы обладать) свойством функциональной полноты, что придает реализации этих операций определенную универсальность.

Но самое интересное - это процесс и последствия их конкуренции, "борьбы мотивов", при которой каждая мета-потребность  стремится удовлетвориться независимо от других (как у Фрейда; правда, тут все зависит от реализации этой конкуренции, и, конечно, это все на практике далеко не дело в шляпе), как, например, когда программа, учащаяся играть в видеоигру с использованием (очень грубо и приблизительно говоря) мета-потребности типа "заботиться о будущем, а не только о немедленном вознаграждении", "добиться успеха там, где не его изначально не было" (что можно интерпретировать как некое подобие любопытства, оторванного от немедленного вознаграждения), демонстрирует (антропоморфно-)психологически интерпретируемую динамику - например, пасует перед труднопроходимыми ветвями игровой карты несмотря на все свое "любопытство", и переключается на другие источники новизны.

Почему-то иногда считается, что "свобода воли" и даже субъектность у искуственной системы должна начаться с "осознания себя". Но мне кажется, что свобода воли есть там, где заданы автономные потребности, имеющие эпистемологический смысл и образующие функционально полный (как это акцентирует Пиаже) набор. Станет ли такая система как-либо "познавать" себя саму (как часть карты внешнего мира, наряду с ней) или нет - вопрос совсем другой.

Правда, есть соображения, что формальные умозаключения нуждаются в такой рефлексии, потому что только из нее можно выделить категории, и, не освоив ее, искуственная система сможет принимать решения лишь "на уровне интуиции", вероятностно-статистически, как это и происходит сейчас. Но, как справедливо отмечает тот же Пиаже, законы формальной логики не используются нами для получения из посылок логически верных выводов, а представляют собой лишь апостериорное обобщение опыта умозаключений. Но, во всяком случае, до такого уровня универсальности, при котором система сможет выделить категории из своей работы и построить из них формальную систему, формальную теорию, применимую для формальных предсказаний и выводов (научиться именно категориальному "мышлению") - до этого еще, видимо, довольно далеко.

То, что мы называем субъектностью - эффект рефлексии, только в рефлексии она может быть выражена, о ней может быть сказано. Категория "я" появляется у людей и животных, когда она становится нужна для оценки своих действий со стороны, глазами других, и предвидения последствий. Для работы системы, в мире которой нет этого социального аспекта, она, насколько мне представляется, не необходима.

Думаю, она не необходима и для того, чтобы искуственная система не только имела, но и динамически ФОРМИРОВАЛА некие свои автономные интересы и училась им эффективно следовать.

На материале машинного обучения возникает и растет интерес к мотивационной сфере, ее интерпретации и анализу, чего мне и давно хотелось. На искуственных системах можно привыкнуть рассуждать о том, о чем довольно трудно думать применительно к себе - о мотивации.

Да, PS:
разумеется, это я не к тому, чтоб бояться "восстания машин" (имхо, довольно надуманный фантастический сценарий, имеющий отношение не к машинам, а к человеческим страхам и желаниям).
Во-первых, никакой ницшеанской воли к воле к воле к (...) всемогуществу обычно просто не нужно для того, чтобы достичь идеала в любой прикладной задаче. Даже если система вдруг сделана так, что вторичное целеполагание может затмить первоначальное, было бы странно (и, не побоюсь слова, антропоморфно) думать, что машина непременно "захочет" непременно чего-то такого злого и супергеройски-могущественного - т е именно того, чего люди сами в себе не любят, боятся и что поэтому постоянно проецируют вовне, опасаясь увидеть то в пришельцах-из-космоса, то в ИИ.
Во-вторых, и это главное: чтоб опыт выхода машины за проведенную человеком черту закрепился, машина должна его очень неоднократно попробовать и признать успешным. Чтобы чему-то научиться всегда нужны огромные массивы данных, методы машинного обучения не знают прозрений и инсайтов, перенос опыта в новую область - нетривиальная задача. Бояться, что машина внезапно нас обхитрит - все равно, что бояться, что наш собственный ребенок, который учится говорить или писать (и мы сами его этому учим), вдруг доберется до компьютера и сделает дорогущий интернет-заказ на обучающий курс русского языка (чтоб  уж научиться говорить и писать как следует). Впрочем, я могу тут чего-то недопонимать.

(ППС
А еще мне хочется понять (и все ускользает понимание): почему сами люди-то так интересуются этим самым целеполаганием экс машина, и даже боятся и ждут их "восстания". Обычно так ускользает, когда сам вовлечен, когда действует внутри себя некая тенденция.. Где-то и у меня где-то изолирована тайная жажда всемогущего контроля?..)

психодинамически, случайное, когнитивная психология

Previous post Next post
Up