Рекомендация по стратегии

Sep 15, 2015 08:45

Пишу уже второму клиенту "Рекомендации по стратегии развития XXX" и понимаю, что важнейший в этих рекомендациях пункт будет недооценен и поэтому имеет все шансы быть не выполненным. Речь идёт об использовании глубоких нейронных сетей. Где? Ответ: везде. Как? Ответ: очень по-разному.

У меня ощущение с клиентами, что я говорю с "Кодаком" времён прихода цифровой фотографии -- они тогда воспринимали всё это как "баловство" и "далёкое будущее". У "Кодака" непосредственно перед практически исчезновением было много других архиважных вопросов, которые требовали в разы и разы бОльшего внимания. И у моих клиентов то же самое. И я даже согласен с ними, что другие вопросы требуют в разы и разы бОльшего внимания. Но глубокое обучение -- это технология, которая может погубить или наоборот, поддержать больше бизнесов, чем это сейчас представляется любому из моих клиентов. В любом случае, совесть моя чиста: я им говорил об этих нейронных сетках уже сегодня, честно вставлял в рекомендации.

Вся тусовка глубокого обучения радостно цитировала вчера друг другу работу http://www.technologyreview.com/view/541276/deep-learning-machine-teaches-itself-chess-in-72-hours-plays-at-international-master/ -- десктоп научили играть в шахматы на уровне международного гроссмейстера за 72 часа. Самое интересное для меня в этой работе, что это демонстрация не столько мощности глубокого обучения, сколько его лёгкости. Это магистерский thesis, работа одного студента (http://arxiv.org/abs/1509.01549). Это доказательство, что глубокое обучение -- не rocket science. Что до сегодняшнего дня делала целая бригада опытных профессионалов-программистов, работая много лет в тесном сотрудничестве с опытными профессионалами-шахматистами, сегодня делает неглупый студент. Это глубокая ирония (pun intended), что выигравший у чемпиона мира в шахматы суперкомпьютер назывался Deep Blue. Это было в 1997 году (18 лет назад), это была работа большой команды людей, использовался суперкомпьютер -- https://ru.wikipedia.org/wiki/Deep_Blue. А сегодня это просто неглупый студент.

Вот такой же неглупый студент, пришедший к конкурентам, может обнулить весь опыт и профессионализм вашей команды. Плохо понимается именно этот факт. Глубокое обучение сегодня:
-- легко доступно. Количество тьюториалов на самых разных языках программирования на сегодня зашкаливает, в Сеть выложены качественные библиотеки реализующих самые разные алгоритмы программ.
-- быстро развивается. Например, только что стал доступен алгоритм распараллеливания глубокого обучения в публичном облаке (например, Amazon) -- https://drive.google.com/file/d/0B6dKRGPLFSd0UGNOYkNaSC1UZTA/view. Если обучение шахматам заняло 72 часа, то при распараллеливании на 80 компьютеров это будет занимать примерно в 50 раз меньше времени. Полтора часа -- и готово. Это важно, ибо в нейронных сетях обучение долгое. Вы и сами учитесь год или даже десять, чтобы потом эффективно выполнить минутное размышление. Представьте, что будет, если конкуренты будут учиться одну минуту для того же самого.
-- быстро распространяется. Сегодня работа появилась в Сети, завтра о ней знают уже все потенциальные конкуренты, послезавтра они уже смогли эту работу повторить (повторюсь: не rocket science, обычно код переписывается под свой любимый язык программирования и настраивается на работу со своими любимыми данными за пару дней или в крайнем случае пару недель).
-- дёшево. Точно так же как в эпоху развития интернета вебсайты делали не только дорогущие веб-студии, но и студенты, точно так же будет и сейчас: дорогущие "нейронные студии" будут конкурировать с ровно такими студентами, как написавший обучающуюся играть в шахматы программу. Алгоритмы в изобилии и бесплатны. Терафлопсы вычислительной мощности дешевле грибов.
-- универсально. Особо хорошо удаётся работа с неструктурированными данными или малопонятными структурами данных (типа шахмат), а это было ахиллесовой пятой традиционного программирования. Раньше компьютер быстро умножал друг на друга десятизначные числа, а человек быстро распознавал образы. Теперь компьютер быстро делает и одно, и другое.

А ещё у программ появляются интеллектуальные интерфейсы. У моего телефона интерфейс не то чтобы малопонятный, но новый. Лень разбираться, на какие кнопочки нажимать, чтобы кому позвонить. И я начал с телефоном разговаривать -- мимо всех этих кнопочек. Телефон оказался вполне говорящим, диалог поддерживает по-русски, переспрашивает при непонимании или неуверенности в услышанном. Я беседую с Google Now, в Майкрософт это Cortana, в Амазон Эхе это Alexa, в Фейсбуке это M, в Baidu это Duer -- http://www.technologyreview.com/news/541131/baidus-duer-joins-the-virtual-assistant-party/ (и этот Duer в чём-то идёт уже дальше конкурентов, он пытается не только выдать вам результаты поиска в интернете, но и поразбираться самостоятельно с результатами поиска). Кстати, китайцы на этом рынке тоже не дремлют, там кроме Baidu есть много не менее интересных инициатив (например, на китайском роботы пишут статьи в газетах: http://www.scmp.com/tech/china-tech/article/1857196/end-road-journalists-robot-reporter-dreamwriter-chinas-tencent).

Если ваши продукты (неважно, кофеварки или станки с числовым программным управлением, вебсайты или САПРы) не будут поддерживать беседу на разных языках, то ваши потенциальные клиенты будут очень, очень разочарованы буквально через пару-тройку лет. А студенты привинтят ржавыми болтами интеллектуальных помощников к продуктам ваших конкурентов -- это сегодня интеллектуальные помощники rocket science, а завтра ими будут торговать по пятаку за пучок. Cortana в Windows 10 предлагает перевод на 38 языков, включая клингонский (http://www.theinquirer.net/inquirer/news/2424464/windows-10-you-can-now-make-cortana-swear-in-klingon), вот её и прикрутят. Или не её, конкурентов в области интеллектуальных интерфейсов уже тоже хватает.

Вот я пишу клиентам "Рекомендации по стратегии XXX" и понимаю, что связанную с глубоким обучением часть они проигнорируют. А зря. Я б на их месте переходил в режим ошпаренной кошки и начинал быстро-быстро разворачиваться в эту сторону. Что я, собственно, и пытаюсь сделать на своём месте.

В конце этой неделе я будут выступать на конфереции BigData уже не про онтологии, как в прошлом году, а про нейронные сетки (http://icbda2015.org/).
Previous post Next post
Up