Как устроена Alpha Go: evgeniirudnyi

evgeniirudnyi

Как устроена Alpha Go

Dec 14, 2021 20:04

В прессе было немало информации о глубоком обучении, искуственных нейронных сетях (ИНС) и Alpha Go. Однако, как оказалось, в действительности все выглядит более прозаично.

'Ко второму классу отнесены гибридные системы, в которых базовая ИНС строит динамическую модель внешнего окружения. На ее основе символьная система вырабатывает решение. В качестве примера указывается система Alpha Go для игры в го и шахматы, которая превзошла человеческий интеллект в данной сфере. В этой системе ИНС на основе исторических траекторий строит на каждом шаге три функции. Первая предсказывает поведение (например, ход в игре), вторая - победителя, третья - значение целевой функции (например, количество очков, набранных при выполнении хода). При этом не накладывается никаких ограничений на семантику внутренних состояний системы, обычно обусловленных требованием восстановления траекторий по внутреннему состоянию модели. Внутренние состояния могут быть представлены любым способом, имеющим отношение к прогнозированию текущих и будущих поведений, победителя и целевой функции. Интуитивно система может сама изобретать для себя правила или динамику, которые приводят к наиболее точному планированию, но которые могут быть сколь угодно далеки от физической реальности. Модель постоянно обучается с единственной целью - как можно точнее оценить эти три функции. Соответственно, для планирования может быть применен любой алгоритм оптимизации, ориентированный на работу с дискретными марковскими процессами и использующий для планирования оценки этих функций. ИНС, строя модель, не участвует в выборе решения.'

То есть, получается, что ИНС в наличии и действительно она играет важную роль, но окончательное решение она не принимает. Вот так-то.

'успехи ИНС во многом обусловлены скрытыми априорными знаниями разработчиков, на основании которых делается выбор структур ИНС и схем обучения, и дальнейший прогресс в искусственном интеллекте невозможен без внесения качественно новых механизмов, предполагающих вербализацию знаний.'

https://bvn-mai.livejournal.com/15023.html

http://blog.rudnyi.ru/ru/2021/12/kak-ustroena-alpha-go.html