Теория сенсомоторного вывода

Jun 05, 2018 18:33



Что вы видите на этой картинке?

Наверняка вы скажите, что видите кружку. Тогда как на самом деле, это всего лишь набор черных линий, нарисованных на плоскости.

Но мы почему-то уверены, что это не набор линий на плоскости, а 3х мерный объект.

Нейробиологи считают, что кора головного мозга шаг за шагом обрабатывает получаемую от глаз информацию, выделяя в ней все больше определенных свойств (паттернов). И так до тех пор, пока мозг не признает, что глаза видят кружку.


Сегодня так работают алгоритмы глубокого обучения на нейронных сетях в задачах распознавания образов.
Обучившись на многих изображениях, алгоритм легко определит, что «видит» очередную кружку, хотя ее размеры, пропорции, цвет и толщина линий - совсем иные, чем у всех прежде «виданных» алгоритмом кружек.
Но при этом алгоритм, не только не понимает, что это кружка, но и, что еще удивительней, не понимает, что перед ним 3х мерный объект.

Он вообще ничего не понимает и бессмысленно спрашивать его, как этот объект может выглядеть при другом угле зрения, какой он может быть на ощупь и может ли в нем быть жидкость.

До недавнего времени стройной общепринятой теории, объясняющей, как кора головного мозга трансформирует плоское изображение в ментальную репрезентацию 3х мерного объекта, не существовало.

Исследование компании Numenta предлагает совершенно революционный подход к построению подобных теорий.

Что такое теория сенсомоторного вывода?

Еще в XIX веке Герман фон Гельмгольц заметил, что, хотя наши глаза двигаются три-четыре раза в секунду, наше зрительное восприятие стабильно. Следовательно, мозг должен учитывать, как двигаются глаза. Иначе нам бы казалось, что мир вокруг нас постоянно дергается три-четыре раза в секунду.

Но ведь точно так же, когда вы прикасаетесь к чему-то, было бы странно, если бы мозг обрабатывал только тактильные ощущения и одновременно не знал, как двигаются ваши пальцы.

Этот принцип объединения движения с изменяющимися ощущениями называется сенсомоторной интеграцией. Как и где сенсомоторная интеграция происходит в мозге, до самого последнего времени оставалось тайной.

Теория, разработанная исследователями из Numenta, позволяет понять, каким образом в мозге осуществляется процесс сенсомоторного вывода (sensorimotor inference). Так авторы теории назвают процесс понимания мозгом структуры объектов той части мира, что информационно доступна ему в настоящий момент через поток сенсорных ощущений.
А говоря простым языком - это процесс, позволяющий мозгу понять, например, при ощупывании неизвестного предмета, что вы держите в руках.

Сенсомоторный вывод выполняется в мозге с помощью специального механизма, называемого авторами аллоцентрической локацией (allocentric location), т.е. определением местонахождения каких-либо объектов во внешнем (по отношению к человеку) мире.

Принципиально важно, что механизм аллоцентрической локации - это часть единого алгоритма работы мозга и потому работает при обработке информации от всех наших органов чувств.

Революционный потенциал теории в том, что она довольно убедительно описывает, каким образом сенсомоторная интеграция происходит во всех областях неокортекса. Причем не как отдельный процесс, а как неотъемлемая часть всей сенсорной обработки. И таким образом получается, что сенсомоторная интеграция является ключевой частью единого «алгоритма интеллекта», реализуемого неокортексом.

Эта теория способна объяснить очень многое и, в частности:
- почему вы воспринимаете кружку в трех измерениях и почему вы можете представить, как бы она выглядела с разных сторон;
- почему ваше восприятие кружки является стабильным, хотя ваш взгляд перемещается и останавливается на разных частях изображения (если для входных данных назначены правильные локации кружки, то неважно, откуда и под каким углом вы смотрите на изображение.

[Пример, как это работает:]
Схематично увидеть, как работает весь процесс, при котором сенсомоторная интеграция посредством аллоцентрической локации осуществляет сенсомоторный вывод, вы можете в виде нескольких рисунков:

- Общая схема сенсомоторного вывода при 3х касаниях предмета, обрабатываемых 3мя колонками неокортекса.



- Распознавание объекта при 3х последовательных касаниях.



- Распознавание объекта при 3х одновременных касаниях.



Результаты моделирования вот такой виртуальной руки (снабженной сенсорами касаний), касающейся каждого из 80 физических объектов, описанных 3D CAD моделями высокого разрешения показали точность распознавания 98,7% при всего лишь нескольких касаниях, смоделированных на нейронной сети всего из 4х уровней (аналогичный результат на традиционных технологиях распознавания требует до 100 уровней обработки и миллионов учебных шаблонов).





В рамках теории сенсомоторного вывода, можно предположить, что обработка любой информации в коре головного мозга связана с локациями. Причем даже тогда, когда эти локации не соотносятся с физическими объектами в мире.

Если это так, то это значит, что мы управляем абстрактными концепциями с помощью тех же механизмов, что используем для физических объектов материального мира. И здесь мы вплотную подходим к ключевой функции сильного/общего интеллекта (интеллекта человеческого уровня) - оперирование абстрактными концепциями.

Человеческий мозг - это единственное существующее доказательство того, что общий тип интеллекта, который мы пытаемся создать, вообще возможен. И поэтому нам нужно попытаться понять, как же мозг достиг этих возможностей.
/Демис Хассибис/

Вся стратегия компании Numenta строится на Biologically inspired machine intelligence - создании ИИ, в основе которого лежат идеи, вдохновленные принципами работы мозга.

Вот почему так важна теория сенсомоторного вывода. Она может позволить строить машины, которые будут узнавать и изучать мир вокруг себя так же, как это делает наш мозг - через движение.

/Источник/



Картинка кликабельна

Сознание, Картина мира, Технологии

Previous post Next post
Up