Про пробочные сервисы и о том, как считаются баллы.

Nov 13, 2013 11:11

С большим интересом ознакомился с исследованиями ТомТома, но хотел бы немного рассказать, как вообще считают пробочные баллы.

Исходные данные практически у всех сервисов - это данные слежения за теми, кто пользуется их приложениями или PND - проще говоря, сервис записывает ваш маршрут движения с его скоростью и направлением, после чего анализирует и сводит его в ту самую картинку с зелеными и красными линиями. Чем больше таких маршрутов - тем точнее картинка. Алгоритм этот достаточно старый, его придумали ребята из СитиГида еще в 1996.
Естественно, используются и другие источники данных - камеры, волонтеры, данные ЦСОД ГИБДД (так работала самая первая версия Яндекс.пробок).

И первая настройка здесь - в какой цвет красить линию по конкретному отрезку улицы - дело в том, что "нормальная" скорость движения, естественно, отличается для разных улиц - то, что пробка для 3ТК - рабочее движение для переулка в центре.
Эта настройка не столько математическая, сколько психологическая - зависит от того, когда люди начинают считать, что попали в пробку.
Мы в Мейле в свое время считали, что для МКАД, например, это скорость движения ниже 40 км/ч, а для Варварки - 23 км/ч.
Со временем ощущение пробки может меняться - люди привыкают.
Насколько я вижу, именно в этом месте Яндекс просто очень оптимистичен - то есть они считают, что люди настолько привыкли к пробкам, что планка "здесь пробка" стоит очень низко. Не думаю, что это специально - скорее просто ошиблись в этой настройке.

Но вернемся к баллам.
Они, опять же с некоторыми "но" просто что-то среднее по всей дорожной сети города - то есть показывают, насколько много пробок в сравнении общим количеством дорог.
Я точно не знаю, как сейчас усредняет баллы Яндекс, но алогритм Мейла довольно простой. Есть классы дорог, чем больше дорога - тем больше у нее вес. После нормировки по весам, считается соотношение количества пробочных участков к общему количеству участков. 10 баллов Мейла означает (для Москвы, для других городов другие проценты), что стоит 23% или больше от всей дорожной сети.
Цифра выбиралась экспериментально, но здорово коррелирует со средней связностью дорог по городу - то есть действительно, при такой загрузке уже практически невозможно проехать без пробок на среднюю в Москве дистанцию.
Естественно, может быть и больше 10 баллов - но это уже не так важно, проехать куда-то все равно уже очень тяжело.

Теперь немного про ТомТом.
Судя по тому, что они говорят про загрузку дорожной сети (кстати, это вообще что? Для какого места? Как усредняется?) - они меряют только количество транспорта на участке, а не его скорость - что, на мой взгляд, довольно бессмысленно - например, любые дорожные работы уменьшают пропускную способность, но не обязательно приводят к пробкам - а их сервис, похоже, это вообще не замечает.
В общем, хотелось бы попросить кого-то из них раскрыть детали расчета, например - что такое загрузка 160% от пропускной способности (пропускной способности чего?) - иначе цифры выглядят очень странно.

Если интересны подробности - буду рад вопросам в комментах, постараюсь ответить.

Disclaimer: Я сейчас не работаю ни в Яндексе, ни в Мэйле - но принимал участие в создании обоих сервисов. Если интересно - в настоящее время занимаюсь системами мониторинга транспорта и оптимизации движения, но не в России.

пробки

Previous post Next post
Up