Машинное обучение в выборных технологиях: ushastyi

ushastyi

Машинное обучение в выборных технологиях

Feb 15, 2016 02:05

Возможно кто-то и в курсе, но для меня интересным открытием стал вклад технологий машинного обучения в предвыборную кампанию Барака Обамы 2012г. По сути аналитическая команда Rayid Ghani создали модель, предсказывающую колеблющихся избирателей и лучший способ склонить их колебания в правильную сторону. Модель "тренировали" и проверяли на реальных данных, то есть людях, в дополнение к имеющейся статистике по нескольким предыдущим выборам. В конце концов для каждого колеблющегося штата и каждого избирателя был выработан прогноз: определился избиратель или нет; если нет, то можно ли и каким оптимальным образом его склонить к Обаме; если да, то есть ли шанс, что противоположная команда его "переманит", и как это предотвратить. Для этого использовалась армия волонтёров, которая связалась с каждым потенциальным колеблющимся (напрямую или опосредованно), чтобы убедить его идти на выборы и голосовать за Обаму. Модель получилась очень детализированная, учитывающая несколько десятков характеристик, почти индивидуальный подход. Во многом это напоминает user-level targeting в интернет-рекламе, только в отличие от рекламы финальный результат наверняка проверяется один единственный раз -- в день выборов, предварительные выборки и опросы дают лишь вероятность.

Любопытно, что никто не задается вопросом, насколько это честно -- хотя для меня все это выглядит манипуляционными технологиями, так как реально влияет на результат. Обама выиграл, вопреки многим прогнозам. По-демократически честно.

Пара ссылок:
http://www.thefiscaltimes.com/Articles/2013/01/21/The-Real-Story-Behind-Obamas-Election-Victory
http://www.kdnuggets.com/2013/01/kdnuggets-exclusive-interview-rayid-ghani-chief-scientist-obama-2012-campaign.html

В интервью есть очень важная цитата:

I think the most important thing 'data scientists' can do is get the science part right. It's easy to be a data hacker, and you do see some immediate benefits just playing around with data, but unless you get the science part right, you can't make sustainable impact.

Я думаю, что самое важное, что могут сделать data scientists -- это правильно понять научную часть проблемы. Довольно просто научиться работать с данными и получить быстрое преимущество, но пока вы не понимаете стоящую за этим науку, невозможно получить воспроизводимые и надежные результаты.

общество, computer science