Что за «индекс самоизоляции» от «Яндекса»?

May 06, 2020 12:37

1. Слово «индекс» означает, что речь идёт не про абсолютные величины. Это синтетическая сущность, которая нужна для сравнения. Т. е. сравнительно больше или меньше показатель в отдельном городе относительно другого. Или в тот или иной момент времени. Индекс не предназначен для расчётов всех бомжей на улице.

2. Это интегральный показатель. Это означает, что индекс рассчитывается из нескольких других. Несколько - это может быть много. Точно больше одного. Т. е. из нескольких источников, которые могут дополнять и подтверждать. А могут и не. Но несколько, конечно же, надёжнее одного показателя (например, количества бомжей на улице). Правда, «Яндекс», конечно же, мог бы и более подробно написать, что и как считают - это полезно. Вот тут написано слишком мало.

3. В социологии есть некоторая магия, которая для личностей «с гуманитарным складом ума» может показаться шокирующей. Ну, например, тот же Венедиктов склонен верить опросам «Левады» и ФОМ. А там совершенно точно не считают бомжей. Там, обычно, выборка - 1600 человек. На всю Россию. И ничего - верит. И даже хвастается рейтингами радио «Эхо Москвы» и ничего у него не свербит.

Суть магии довольно проста: если мы из мешка со перемешанным рисом (генеральная совокупность) будем случайно доставать рисинки, тщательно их разглядывать и подсчитывать, то по частоте попадания дикого и белого риса, в какой-то момент, мы сможем сказать, в какой пропорции они там перемешаны. Ну, примерно. Не точно, до числа рисинок, но достаточно, чтоб определить пропорцию. И чем больше достаём - тем точнее будет. В пределе, мы пересчитаем все рисинки, но для приблизительной пропорции нам будет достаточно нескольких сотен измерений.

Так вот, для расчёта «индекса самоизоляции» будет достаточно несколько тысяч раз спросить случайного человека: дома он или попёрся куда. У «Яндекса» такая возможность есть: он просто смотрит на активность в приложениях типа «Навигатор» или «Карты» (как реально сделано, «Я» не раскрывает, а зря).

А поскольку пользователей «Я.Карт» довольно много (миллионы), то, в теории, этим измерениям и расчётам из них можно доверять.

4. Мелкая деталь: индекс самоизоляции вычисляется в баллах - от ноля до 5 с одним десятичным знаком. То есть, шкала «от 0 до 50». Это означает, что точность индекса - плюс/минус 2% (одна пятидесятая = 2%). Что вполне себе соответствует и сильно точнее социологии методом опроса (там, как правило, доверительный интервал в 2,5% с вероятностью в 95%).

ЭРГО: «Яндексу» можно доверять ровно в той же мере, что любому другому исследователю. А математика и часть её теории вероятностей - полезна. Изучай математику - не будь как Венедиктов.

https://seoded.blogspot.com/2020/05/index-samoizolyacii.html

коронавирус, технологии, расширяя кругозор, яндекс

Previous post Next post
Up