Вместо предисловия
Еще пару недель назад рассмеялся бы над любым, кто сказал бы, что за неделю перед выборами мэра я буду писать в поддержку Собянина. Но вот я это пишу. Признаюсь, было дело, проскочила мыслишка, а не подождать ли с публикацией результатов до выборов, дабы дать городу лишний шанс на "светлое будущее". Быстро отогнал ее прочь. Я и в старые времена не шибка подстраивался под марксистско-ленинскую идеологию, поэтому теперь мне вдвойне негоже пытаться подгонять итоги исследования под политическую ситуацию.
Началось все с публикации достопочтимого
eugenyshultz "
Яндекс.Пробки ВРУТ ?", в которой блоггер обратил внимание на более позитивное представление сервисом Яндекс-пробки (ЯП) сведений о дорожных заторах в Москве. "Наметанный глаз разведчика" заприметил в этом предвыборную "туфту" ЯП в сговоре с командой Собянина. Отсутствие доступа к данным не смутило Евгения, он пошел по пути лесковского Левши: "Мы люди бедные и по бедности своей мелкоскопа не имеем, а у нас так глаз пристрелявши", благо, дорожная ситуация это такая область знаний, "когда и так из окна автомобиля все видно". :)
ЯП, вместо того, чтобы проверить, не вкралась ли ошибка в расчеты, начал оправдываться доводить до потенциальной аудитории идею о том, что никакого отношения к предвыборной кампании публикуемая ЯП ситуация не имеет и в качестве подтверждения
заявил: "В целом прирост пробок год от года незначителен. С 2011-го он составляет примерно пять процентов в год". Нунифигасе, незначительный прирост по 5% в год... нудаладна, придраться формально к коллегам невозможно, поскольку непонятно, в каких "попугаях" ЯП измеряет этот прирост. Истинная цель, которую
eugenyshultz ставил перед собой мне не известна, это может быть как явно видимая - "вывести ЯП на чистую воду", там и неявная - принудить ЯП к публикации более детализированных данных. Однако, последовавшая дискуссия привела к тому, что ЯП свои данные опубликовать "постеснялся", в результате Евгений Шульц (в миру - Александр Евсин)
на встрече в прямом телеэфире без особых усилий "порвал" голословную, то есть не опирающуюся на объективные данные, аргументацию ЯП: "Во-первых, я сам стал ощущать, что те пробки, которые раньше проходили по нотификации восьми баллов, сейчас они идут по шести. Во-вторых, естественно, это очень выгодно с политической точки зрения, пробки давно стали политической проблемой, поэтому я совершенно не исключаю сговора, даже заговора.". "Дожал" Евгений их железобетонно незыблемой конспирологической аргументацией:
Представьте, что к начальнику «Яндекс.Пробки» приходит сам мэр либо его доверенное лицо. Есть же несколько вариантов, не так чтобы немедленно поменять балльность. Естественно, «Яндекс» тогда скажет: «Идите далеко и надолго», а так, что вот вам деньги, а третий вариант - давайте мы вам будем предоставлять вовремя все данные по перекрытиям, подключим систему своего мониторинга, а вы нам взамен на это, пожалуйста, на два балла пробочки снизьте, это же всем лучше будет. Это же не вводит в заблуждение конкретного водителя, это просто влияет на широкую аудиторию, когда говорят, что 8 баллов или 6. Чистое политическое решение.
Отмечу, моя личная субъективная оценка вполне идентична субъективной оценке Шульца: мне как водителю кажется, что транспортная ситуация в Москве год из года в год становится только хуже и хуже. Я бы не заинтересовался этой темой, если бы не знал достоверно, что на самом деле это только "обман зрения". По роду своей деятельности мне приходится работать с объективными данными измерений скорости движения автомобилей, речь идет о десятках миллиардах измерений. Причем период сбора данных, которым располагает "
Пробковорот" (так называется информационная система с которой я работаю) начинается в середине нулевых, однако статистически значимый, регулярный и сопоставимый массив данных в Пробковороте присутствует с апреля 2007 года, поэтому у меня есть возможность наблюдать не только за "сегодняшней" заторной картинкой, но и понимать, что происходит с "заторным климатом" столицы. Так вот, "средняя заторная температура" по Москве за последние шесть лет не имеет постоянно растущего тренда. Яркий пример, который кое-кто сумел заприметить "на глаз" - снижение количества заторов в 2009-м - начале 2010-го г.г. Это было кризисное время, автодилеры с огромным трудом вели свой бизнес.
Что такое Пробковорот
Пробковорот - это информационная система, созданная для поддержки выбора маршрутов для навигационной системы "PocketGis". Это первая реально заработавшая в Москве система обмена сведениями о трафике, основанная на принципе обратной связи: едущие по дороге автомобили регулярно передают на сервер информацию о своем перемещении, сервер систематизирует, анализирует и статистически обобщает эту информацию и предоставляет ее установленным на автомобилях навигационным системам в качестве основы для прокладки наиболее оптимального с учетом заторов маршрута.
Пробковорот - это самое сплоченное в Москве пробкоориентированное
интернет сообщество, в котором собрались в том числе аналитики из различных областей науки и бизнеса.
Пробковорот - это уникальный многолетний банк данных измерений о дорожной ситуации. Пробковорот с самых первых дней своего существования был ориентирован именно на статистический анализ и статистическую обработку, на выявление любых закономерностей в заторной ситуации, поэтому Пробковорот является лидером именно в статистическом анализе заторов.
С научной точки зрения Пробковорот ориентируется на используемую в метеорологии методологию, в том числе на принцип контроля качества путем регулярного сравнения данных прогноза с данными последующих реальных измерений. Разумеется, для того, чтобы делать максимально точные прогнозы необходимо иметь максимально точные модель данных и банк данных.
Методика отбора и анализа данных
Для статистических обобщений в рамках этой статьи отбирались привязанные к участкам дорожной сети результаты наблюдений за скоростью перемещения порядка 30 тысяч транспортных средств. Были отброшены данные, собранные на круговых и многоуровневых развязках, данные по местным (второстепенным) проездам, по участкам дорог без покрытия и по прилегающим территориям. Средняя скорость рассчитывалась по методике расчета средних потерь времени.
Данные сгруппированы пространственно по шести зонам:
Зона1 - габаритный прямоугольник описан вокруг Садового кольца;
Зона2 - габаритный прямоугольник описан вокруг Третьего транспортного кольца, за вычетом территории Зоны1;
Зона3 - габаритный прямоугольник описан вокруг условной территории Четвертого транспортного кольца, за вычетом территории Зоны1 и Зоны2;
Зона4 - габаритный прямоугольник описан вокруг МКАД, за вычетом территории Зоны1, Зоны2 и Зоны3;
Зона5 - территория ближнего Подмосковья (~64 х 59 км), за вычетом территории Зоны1, Зоны2, Зоны3 и Зоны 4;
Зона6 - территория дальнего Подмосковья.
Группировка данных по времени осуществлялась по пяти типовым интервалам времени:
УтроБ - утреннее пиковое время, будние дни;
День1Б - первая половина от утреннего до вечернего пикового времени, будние дни;
День2Б - вторая половина от утреннего до вечернего пикового времени, будние дни;
ВечерБ - вечернее пиковое время;
Ночь - ночное время.
Периоды пикового времени были определены при помощи анализа многолетнего распределения средних скоростей в зависимости от времени суток:
Что говорят цифры
Проведенный анализ не оставляет поводов для сомнений: начиная с марта-апреля 2013 года транспортная ситуация в целом по Москве улучшается.
Транспортная ситуация внутри Садового кольца стабильно улучшается начиная с июня 2012 года, в феврале и апреле 2013 года средняя скорость в этом районе достигала исторических максимумов за период наблюдения с 2007 года. С учетом времени начала положительной динамики внутри Садового кольца нет оснований привязывать ее именно к введению платы за парковку.
Изменение транспортной ситуации в районе МКАД в сопоставимо с изменением транспортной ситуации по Москве в целом. Это может указывать на то, что в результате разгрузки МКАД улучшилась ситуация в целом по Москве, но так же можно предположить и обратную связь: в результате улучшения ситуации в целом по Москве произошло улучшение ситуации на МКАД.
Небольшой положительный эффект, привязанный по времени к введению ограничения движения грузовового транспорта по МКАД наблюдается в вечернее пиковое время в зоне ближнего Подмосковья.
Почему следует доверять именно этим данным?
Для начала - уже только потому, что других нет. Не смотря на публичный резонанс, последовавший за заявлением Шульца о фальсификации данных ЯП, на текущий момент ни одна из существующих в Мосве систем сбора информации о трафике не опубликовала аналогичных результатов исследований. Что касается субъективного мнения, следует понимать, любые "исследования", проводимые "по памяти на глаз", во-первых, не полны, во-вторых, субъективны и в третьих, неточны. В качестве наглядной иллюстрации этому в старые добрые студенческие времена нам на первой лекции по метрологии предлагали "по памяти на глаз" оценить диаметр двухкопеечной монеты образца 1961 года. Никто даже с точностью в три миллиметра не угадал, причем все занизили оценку.
Поскольку у меня нет возможности сравнить данные Пробковорота с данными других систем, были предприняты шаги, направленные на то, чтобы проверить данные по критериям внутренней непротиворечивости и объяснимости. Данные были разбиты на подгруппы и анализировались независимо, результаты анализа сопоставлялись. Аналогичное исследование проводилось в начале августа, на основании его был сделан прогноз о возможно благоприятных итогах августа, который был подтвержден по данным измерений.
Могут ли эти данные не соответствовать действительности?
Вероятность не соответствия данных действительности безусловно положительна и отлична от нуля. Опубликованные выше диаграммы не соответствуют действительности уже только потому, что в диаграммах не приведены сведения о доверительных интервалах, которые в силу существенно стохастической природы скорости транспортного потока чудовищно велики. Однако, по моему мнению, для оценки тренда (динамики) средних скоростей эти данные вполне пригодны. Тенденция повышения средней скорости движения автомобилей в Москве, вполне выражена для различных зон и периодов времени, начиная с марта-апреля 2013. Теоретически данная тенденция может быть вызвана систематическими возмущениями в исходных данных, например, изменением состава наблюдаемых автомобилей от преимущественно грузовых до марта 2013 г. к преимущественно легковым после марта 2013 г.. Для того, чтобы исключить подобную возможность было проведено контрольное исследование в Зоне6 (дальнее Подмосковье), которое показало отсутствие значимого повышения средней скорости в этом районе в период с 2012 по 2013 г.г., что указывает на сопоставимость выборки автомобилей.
Особо отмечу, мне наверняка известно о том, что эти данные никто не корректировал в соответствии с пожеланиями предвыборного штаба Собянина. Никого на слово мне верить не призываю, для сомневающихся специально написал следующий абзац.
Как быть с конспирологическими теориями?
А никак. Пусть Шульц попробует доказать, что его не зомбировали во время "
случайной встречи с Навальным", по ходу которой он настолько радикально переменил свое отношение к этому кандидату. ;)
Вся конспирология основана на принципиальной невозможности опровергнуть домыслы и вымыслы. Причем, чем более чудовищный вымысел, тем сложнее его опровергнуть. Для проверки на практике рекомендую попробовать кому либо из "стойкосомневающихся" доказать, что Вы не марсианин. :)
P.S. Но голосовать за Собянина я все равно не стану. Наука - наукой, а выборы от данных наблюдений мы решили изолировать в самом начале. ;)
Во-первых, не следует забывать о том, сколько денег за время правления Собянина потрачено на реконструкцию автомагистралей и прочие околотранспортные мероприятия.
Во-вторых, важно помнить, что у Собянина есть
департамент транспорта, одной из задач которого является мониторинг транспортной ситуации. Молчание дептранса о положительной динамике указывает на то, что мониторингом транспортных потоков они толком не занимаются. То есть, системная работа в области транспорта не ведется.