Посмотрите, чем они занимаются, - они воплотили наши идеалы ВСЁ В ОДНОМ И ОДНО ВО ВСЁМ!
https://quid.com Самая быстрорастущая область науки о механизме обучения
Джош Миллер, Карлос Фольгар и Джес МакКуан
03.28.2017
Вы видите эффекты машинного обучения во всем мире, так как технические компании и лаборатории используют его для всего, от
редактирования Google Фото, до
прогнозирования глобальной нехватки продовольствия .
Но задолго до того, как они появятся в любом продукте, приложения для машинного обучения, вероятно, были предметом научных работ. На самом деле, проанализировав десятилетние документы о механическом обучении, кажется, что ученые и ученые все больше интересуются этой темой на треке, примерно соответствующем взрыву недавних применений на рынке технологий.
Научная и учебная литература по компьютерному обучению в университетах США, 2007-2016 годы.
В Quid мы более подробно рассмотрели научные статьи о механическом обучении - около 5000 человек из университетов США - чтобы увидеть, как меняется наука вокруг нее.
Данные для анализа взяты из SCOPUS, самой большой базы данных рефератов и цитат из рецензируемой академической литературы со всего мира. Всего за несколько минут программное обеспечение Quid просеило тысячи документов об обучении машинам и создало сеть, в которой соединения между узлами представляют сходство в языке между ними.
Карта сети выглядит так:
На карте мы заметили несколько интересных тенденций:
Во-первых, текстовый анализ и обработка естественного языка составляют самый большой кластер в сети. Научные статьи здесь указывают на успехи в механическом обучении через распознавание образов на языке, что приводит ко всему от более быстрого
анализа преступности до более эффективных
оценок клинических описаний .
Хотя значительная часть сети связана со здоровьем и медициной, четвертый по величине кластер сосредоточен на вопросах окружающей среды; здесь, машинное обучение помогает предсказать, как изменения климата влияют, скажем, на мелких млекопитающих на Аляске или на
виды растений в полуострове Таиланд .
Кластер искусственных нейронных сетей, расположенный в левом верхнем углу, кажется, имеет ногу в обоих мирах: значительное количество документов о нейронных сетях касается здоровья человека, в то время как другие относятся к здоровью озер или лесов.
Машиноведение и здоровье
Часть сети, относящаяся к здравоохранению и наукам о жизни, образует отдельный регион справа, при этом коммерческие приложения занимают левые.
В середине: технологии или принципы, которые могут использоваться в любом приложении машинного обучения, например, оптимизация и статистическое прогнозирование.
Более подробно рассмотрим вопросы здравоохранения и наук о жизни, мы видим, что категория распадается на захватывающие области медицины, такие как генетика, рак и мозг.
Анализ белка, второй по величине кластер в сети, представляет собой обширную область исследований, в которой машинное обучение помогает всему, от картирования ДНК-белковых взаимодействий до прогнозирования реакции человека на вакцины против гриппа.
Самые быстрорастущие районы
Итак, какие области исследований растут быстрее всего в медицинских приложениях машинного обучения и, фактически, во всей области? Два в частности: квантовая химия и клиническое принятие решений.
Темы статей в квантовой химии, по меньшей мере, амбициозны. В одном документе с 2016 года используется машинное обучение для более эффективного проектирования новых и усовершенствованных диэлектрических полимеров. В последнее время бумаги в общей категории резко возросли, всего 10 бумаг в 2013 году до 44 в прошлом году.
При принятии клинических решений врачи начинают пожинать плоды применения машинного обучения в огромных новых магазинах электронных медицинских записей.
В одной из работ исследователи из Массачусетского технологического института использовали новый метод машинного обучения SLIM (линейные линейные модели Supersparse Linear Integer) для проверки гипотезы о том, что диагностический скрининговый инструмент, основанный на общедоступной медицинской информации, будет превосходить один, основанный исключительно на сообщенных пациентах, связанных с симптомами.
Наиболее цитируемые документы
В Quid мы можем точно определить, какая отдельная статья об машинном обучении приобрела наибольшую тягу в научном сообществе за последнее десятилетие, измеряемую с точки зрения цитирования.
Один из них выделяется значительно выше остальных, новаторское исследование по генетическому секвенированию с помощью MIT и ученых из Гарварда с 2011 года: «Структура для раскрытия вариаций и генотипирования с использованием данных секвенирования ДНК следующего поколения». Первоначально опубликованный в журнале Nature, цитируется 2334 раза всего за шесть лет.
Лучшие университеты
Университеты конкурируют на нескольких фронтах, но не на арене более яростно, чем на академические исследования.
- Анализ НЛП и текста
- Анализ белков
- Клиническое принятие решений и EHR
- онкология
- Live Cell Imaging
- Астрономическая съемка
- оптимизация
- Статистическое прогнозирование
- Функциональная МРТ и морфометрия мозга
По объему Гарвардский университет является самым известным учреждением за десятилетний выпуск документов для машинного обучения.
В приведенной выше диаграмме мы видим, что Гарвард поставил огромный исследовательский акцент на здравоохранение и машинное обучение, а также анализ белков и НЛП и анализ текста. Другие крупные игроки в НЛП и анализ текста: Карнеги Меллон и Университет Висконсина.
Другие названия университетов связаны с конкретными нишами: например, Мичиганский университет часто упоминается в анализе белков, и UC-Berkeley часто упоминается в статьях, где машинное обучение применяется к астрономической съемке.
Лучшие компании
Конкуренция в области машинного обучения столь же жесткая в частном секторе, что Microsoft, IBM и Google связаны с большинством академических работ.
- Компьютерное оборудование
- Анализ НЛП и текста
- оптимизация
- Компьютерное зрение
- Большая аналитика данных
- Статистическое прогнозирование
- Социальные медиаконтент
- Кибер-безопасности
- Автономные агенты
В последние десятилетия Microsoft занимает самую большую долю в опубликованной работе, но IBM чаще всего проявляется в документах, связанных с машинным обучением и компьютерным оборудованием.
Конечно, не все приложения машинного обучения - такой серьезный бизнес. На этой неделе студенты Университета Сан-Диего преподавали алгоритм создания новых танцев с использованием данных из видеоигры
Dance Dance Revolution .
Но для людей, заинтересованных в серьезных применениях машинного обучения - или даже в любой области академических исследований, - Quid может перегонять тысячи документов всего за несколько минут.
Если вам интересно узнать больше о машинах или другой учебной теме, напишите нам на hi@quid.com.
Ключевые слова:
машинное обучение ,
здравоохранение ,
анализ белков ,
электронные медицинские записи