Современные чудеса (впрочем, это последние годы, когда такое воспринимается, как чудо):
-- парализованный человек управляет F-35 (пока только на тренажёре) через нейроимплант:
http://www.washingtonpost.com/news/speaking-of-science/wp/2015/03/03/a-paralyzed-woman-flew-a-f-35-fighter-jet-in-a-simulator-using-only-her-mind/-- дроны разговаривают с авиадиспетчерами, как обычные люди:
http://www.rmit.edu.au/news/all-news/media-releases/2015/february/talking-drone-offers-aviation-safety-boost/ (и помним, что это сделали австралийцы. Agent-based система управления полётами именно австралийская, так что там всё не случайно. Теперь ждём, когда приятным голосом заговорит с пилотами и система управления полётами, в том числе она будет мило беседовать и с дронами тоже).
Почему возможны такие прорывы? IMHO, это representation learning.
А почему такой прорыв в representation learning? Не только потому, что случились нужные прорывы в алгоратмах и понимании. Ещё и сработал закон Мура: для representation learning начало хватать вычислительных мощностей (и начинает работать положительная обратная связь: чем больше теперь будет успех в этой области, тем больше производители компьютерного железа будут разворачиваться в эту сторону -- как когда-то произошёл разворот от центральных процессоров в сторону видеопроцессоров).
Я уже поминал тут великолепную презентацию Nathan Intrator о нейроинтерфейсах (
https://events.yandex.ru/lib/talks/2768/) -- она вся про то же самое, про "богатые репрезентации", множество маленьких экспертов-фич, каждый из которых говорит что-то незначительное про крохотный аспект данных. Но коллектив таких экспертов (нейронная сетка ли, или любая другая "глубокая" или даже "мелкая" архитектура) способен на многое. Сам мозг тоже так работает, Натан приводит довольно необычный пример, анализа звука мозгом. Хотя 1 нейрон имеет разрешение 1миллисекунду, их коллектив достигает разрешения 100нс (это на 1:06:38 презентации). Когда мучаешь одни и те же данные разными способами много-много раз, то можно мого чего узнать. Если перейти на подобные принципы в компьютерном железе, то это будет архитектурная революция.
Мой предыдущий пост про SysMoLan (
http://ailev.livejournal.com/1169972.html) поднимает вопрос о центральной роли множества обработок/процедур с разными целями для каких-то одних и тех же данных -- переходя от неструктурированных данных и текстов к структурированным данным. Если вы ставите много-много разных целей (у вас много-много разных соображений по поводу того, что спросить, вы ищете смыслы, я тут сводил всё к "прагматике") по поводу каких-то одних и тех же данных, то каждый ответ такого "узкого специалиста в одном вопросе" не имеет значения (не несёт в себе значимой семантики). Но в целом толпа таких "узких экспертов" может быть неизмеримо умней любого самого умного из них самих, а также любого самого умного из нас, белковых. В результате киборги всё заполоняют, и мы живём последние годы, в которые их возможности воспринимаются как чудесные.
Даже нумерологам киборги могут пригодиться, они ведь видят невидимое не хуже, чем человек! Можно гадать не только по кофейной гуще, современный Android, например, гадает по кирпичным стенам и окнам (он видит надписи в регулярных структурах) --
http://vvagr.livejournal.com/2050638.html