Статистическая обработка результатов: tairyfails

tairyfails

Статистическая обработка результатов

Mar 01, 2017 20:48

Проверка на наличие тренда

Что мы неявно подразумеваем, когда начинаем статистическую обработку результатов? Мы говорим о том, что результат эксперимента является случайной величиной. Фактически мы реальному объекту сопоставляем некий абстрактный математический объект. Ведь случайная величина - это некоторая математическая абстракция, там есть своя аксиоматика, из аксиом выводятся теоремы и, в конечном счете, формулы, которыми мы пользуемся. Поэтому когда мы делаем такой шаг, то сперва нужно убедиться, что наш объект адекватно отражается в этой математической абстракции. В ряде случаев даже первый взгляд позволяет увидеть, что это не так - достаточно посмотреть на зависимость результата от номера измерения. Посмотрим на графики (рис. 1).

Рис. 1. Разные типы зависимости результата от номера измерения. Иногда взгляда на такой график достаточно, чтобы увидеть явный тренд (б) и понять, что выборку в целом нет смысла рассматривать как результат регистрации случайной величины.

На рис. 1б есть явный тренд. Если вы получили такой результат, и не посмотрели на зависимость результата от номера измерения, можно попасть в следующую ловушку.

Допустим, вы рассматриваете выборку с рис. 1б без связи с номером измерения. Вы смотрите на этот набор чисел и вам кажется, что это результат измерений некой случайной величина (рис. 2). Вы можете даже провести проверку на нормальность (о чем речь пойдет в дальнейшем) и получить положительный ответ. Почему рассматривать такую величину как случайную опасно? Потому что ваша модель теряет предсказательную силу. Вы принимаете гипотезу, что эта величина является случайной, находите параметры случайной величины - математическое ожидание и дисперсию. И далее вы начинаете искать в модели ответы на вопросы, например: что мы получим в одиннадцатом эксперименте? Модель случайной величины выдаст вам, что, скорее всего, вы получите математическое ожидание, но с какой-то вероятностью будете от нее отклоняться в ту или иную сторону (рис. 2) - ожидаемый разброс будет порядка корня из дисперсии. Но на самом-то деле в одиннадцатом эксперименте вы получите скорее всего, величину на нижней границе диапазона (рис. 2). Модель случайной величины будет неадекватно отражать реальность. Можно сказать, что это связано с тем, что вы выбрасываете из рассмотрения причинно-следственные связи, которые здесь явно присутствуют. При этом результаты статистической обработки будут выглядеть вполне правдоподобно, и ошибки в ваших расчетах могут обнаружиться очень поздно.

Рис. 2. Игнорирование тренда приводит к тому, что модель случайной величины не имеет предсказательной силы.

Если же тренда нет (рис. 1а), целесообразно рассматривать такую величину как случайную.

Тренды в экспериментах часто присутствуют. Они могут быть связаны с поведением экспериментатора, когда он постепенно «набивает руку».

Простой пример: измеряется время, за которое образец тонет в сосуде с жидкостью. Вначале экспериментатор держит предмет крепко и долго примеряется, прежде чем опустить в воду, а впоследствии его движения становятся быстрее, и он удерживает образец за кончик. В результате вначале он оставляет на предмете больше жирных следов, и сила сопротивления при движении образца в жидкости в начале эксперимента и в конце разная.

Также наличие тренда может быть связано с постепенными изменениями состояний измерительной системы. Например, рост температуры из-за джоулева тепловыделения приводит к изменению электрических сопротивлений, вязкости и плотности жидкостей и т.п.

Конечно, эксперимент должен быть хорошо продуман, и одним из аспектов при планировании как раз является минимизация «посторонних» факторов, влияющих на результат. Однако никогда нельзя исключать, что при планировании что-то упущено из виду, и пренебрегать хотя бы простыми проверками.

Что делать, если тренд обнаружился? Попытаться понять причину появления тренда, устранить ее и повторить измерение. Либо принять наличие тренда (если устранить причину его появления нельзя) и учитывать зависимость от номера измерения.

Среднее значение и среднеквадратичное отклонение. Неравенство Чебышева

Цель вычисления среднего значения интуитивно понятна. Подразумевается, что наиболее вероятное значение искомой величины - это среднее значение опытных измерений. А отклонения отдельных измерений от среднего вызваны наличием погрешности, т.е. действием неконтролируемых «посторонних» факторов, от которых мы не можем избавиться.

Зачем вычислять средневкадратичное отклонение?Дисперсия позволяет нам начать говорить о величине вероятности получить то или иное отклонение. Имея только математическое ожидание, мы ничего про вероятность сказать не можем. Математическое ожидание - просто наиболее вероятное значение (это в строгом смысле не верно, но сейчас не будем углубляться в детали). А когда добавляется дисперсия, мы получаем возможность отвечать на вопросы такого сорта: «С какой вероятностью у нас значение измерения выйдет за границы такого-то диапазона?». Хотя бы оценочно.

Часто оценки такого типа даются именно для нормального распределения. Действительно, если есть уверенность в том, что распределение нормальное, возникает возможность рассчитать вероятность того или иного отклонения. Возникает четкая связь между величиной отклонения и вероятностью. Если распределение другое, но также известное, формулы меняются, но их также можно ввести. Однако что если у нас нет информации о типе распределения, однако есть его основные параметры - математическое ожидание и дисперсия?

Есть простая формула, позволяющая делать оценки в такой ситуации - неравенство Чебышева.

Т.е. рассчитать вероятность, зная только математическое ожидание µ и дисперсию σ2, в общем случае нельзя, но можно дать оценку сверху, что также зачастую полезно. Например:

Вопрос: «Какова вероятность того, что отклонение результата от математического ожидания превысит 2σ?»

Решение. По формуле (1) берем a=2σ и получаем: «не более 25%».

Или обратная задача:

Вопрос: «Необходимо указать допустимое отклонение таким образом, чтобы выход за его рамки происходил не более чем в 1% случаев. Какое отклонение указать?»

Решение. Берем P=0.01 и получаем a=10σ.

Оценка сверху (1) часто будет очень завышенной. Сравним, например, с результатами расчета для нормального распределения. По неравенству Чебышева вероятность получить отклонение больше 3σ - не более 11%. А для частного случая нормального распределения - 0,27%. Разница существенна. Однако в ситуации, когда по каким-либо причинам не установить тип распределения случайной величины, неравенство Чебышева может быть полезным.

Особая роль нормального распределения

Часто встречается восприятие нормального распределения как единственного допустимого для экспериментальных данных. Если распределение результатов измерения оказывается отличным от нормального, это воспринимается как дефектность эксперимента.

- Почему, получив распределение результатов, отличное от нормального, вы считаете результаты «плохими»?

- Я имел в виду, что в данном эксперименте результат должен быть случайной величиной. И иметь нормальное распределение.

- А почему сцепляются обязательно эти две вещи? Почему обязательно результаты эксперимента должны иметь именно нормальное распределение? Чем это распределение выделяется среди других?

- Есть центральная предельная теорема, согласно которой при большом числе измерений любая величина стремится к нормально распределенной…

- А можно уточнить это утверждение? Смотрите: при каждом отдельном измерении мы получаем очередное значение случайной величины. Распределение случайной величины, само по себе, при этом не меняется. Оно одно и то же - ведь не меняется объект измерения. Что именно стремится к нормальному распределению?

Рассмотрим простой пример. Допустим, наш эксперимент состоит в бросании обычного шестигранного кубика. Распределение вероятности результатов при каждом броске - однородное, вероятность получить любое значение одинакова и равна 1/6. Это распределение будет описывать бросок и при первом измерении, и при тысячном.

Центральная предельная теорема начинает работать, когда мы начинаем складывать результаты измерений. Смотрите: если мы бросаем кубик два раза и складываем показания, распределение получившейся величины уже неоднородно! Это легко увидеть - каждый бросок дает нам 6 исходов, а поскольку броски независимы, при двух бросках мы получаем 6х6=36 независимых исходов, каждый из которых равновероятен. Минимальное и максимальное значения мы можем получить только одним способом (2=1+1, 12=6+6). Вероятность подобных исходов будет 1/36≈3%. Однако значение 7 можно получить уже шестью способами -7=1+6=2+5=3+4=4+3=5+2=6+1. И вероятность этого исхода будет 6/36≈17%. Распределение вероятности для суммы результатов двух бросков имеет вид треугольника (рис. 3б).

Рис. 3. Распределение вероятности результата броска шестигранного кубика (а), суммы двух бросков (б), суммы трех бросков (в), суммы четырех бросков (г).

Если мы бросим кубик три раза, уже возникает линия, напоминающая гауссово (нормальное) распределение (рис. 3в).

Какое отношение это имеет экспериментальным измерениям? Можно заметить, что при обработке экспериментальных данных также происходит сложение результатов независимых измерений - при вычислении среднего значения (при оценке математического ожидания). Значимость нормального распределения связана с этим: вне зависимости от того, какое у вас распределение при однократном измерении, если вы провели очень много измерений и вычисляете среднее, оно будет иметь нормальное распределение.

Второй момент, связанный с центральной предельной теоремой: она дает информацию о дисперсии усредненного результата многих измерений. А именно, если дисперсия в однократном измерении σ2 (замечу еще раз, мы ничего здесь не утверждаем о распределении однократного измерения, оно может быть любым), при суммировании результатов большого числа измерений N дисперсия составляет Nσ2. Кажется, что она возрастает, но ведь мы при усреднении делим сумму на N - поэтому среднеквадратичное отклонение усредненного результата будет σ/sqrt(N).

Это гарантирует, что при увеличении числа измерений вне зависимости от распределения одного измерения усредненный результат будет все меньше отличаться от математического ожидания. Правда, в то же время из теоремы следует, что дисперсия будет сокращаться медленно - лишь как корень из числа измерений.

Пример. Допустим, проводится эксперимент с достаточно большим разбросом. Пусть вы измеряете некоторое расстояние, и ваши точки ложатся в диапазон 10-20 см. Возьмем для оценки среднеквадратичное отклонение однократного измерения - 5 см. Вы проводите много экспериментов, усредняете результат, и ожидаете, что таким образом вы достаточно точно вычисляете математическое ожидание вашей случайной величины. Например, 100 измерений - казалось бы, достаточно много. На самом деле поскольку отклонение усредненного результата меняется примерно как σ/sqrt(N), при 100 измерениях отклонение сократится только в 10 раз - с 5 до 0,5 см. Результату можно будет доверять лишь с точностью порядка 1 см.

- Когда я считаю дисперсию, сколько значащих цифр оставлять?
- В принципе, теория вероятности дает ответ на этот вопрос. Выполнив серию измерений, мы вычисляем среднеквадратичное отклонение. Сама по себе эта величина является случайной. И для нее можно оценить разброс, вычислив ее дисперсию. Это и будет оценка разброса, который можно ожидать для данной величины. Теория вероятностей дает связь дисперсии среднеквадратичного отклонения S и дисперсии исходной измеряемой величины s. А именно,

S=s/sqrt(2*n)

В частности, при 50 измерениях, дисперсия среднеквадратичного отклонения будет S~s/10. Это значит, что ожидаемый разброс для среднеквадратичного отклонения - 10%. Можно трактовать это таким образом, что значимой является только первая цифра. Для того чтобы получить надежно вторую значимую цифру среднеквадратичного отклонения, необходимо уже сильно увеличить количество измерений - только при n=5000 мы получаем S порядка s/100.

Итак, нет никаких гарантий, что в эксперименте, который вы проводите, измеряемая величина имеет нормальное распределение. Оно может быть другим. В каком случае можно ожидать, что будет нормальное распределение? Опять же, ответ дает центральная предельная теорема: если погрешность складывается из множества независимых случайных факторов.

Пример. Регистрируются слабые механические колебания объекта, и на стрелку прибора действуют шаги людей, которые ходят в соседних комнатах здания. Действия людей не скоординированы, поэтому если их достаточно много, можно ожидать, что отклонение, вызванное их шагами, будет нормально распределенной случайной величиной.

Пример 2. Излучение звезды проходит к нам через атмосферу, неоднородности которой рассеивают свет. В результате регистрируемая яркость будет колебаться. Свет пересекает множество независимых друг от друга неоднородностей в разных слоях атмосферы, поэтому можно ожидать, что связанной с этим отклонение будет нормально распределенной случайной величиной.

В принципе, в физических экспериментах, стараются прийти именно к такой ситуации: убрать все случайные факторы и свести случайность к минимуму. Тогда оказывается, что та случайность, которая осталась, это множество вносящих небольшой вклад неконтролируемых факторов. И даже для одного измерения возникает нормальное распределение.

Но если исследуется технический объект (скажем, некое техническое устройство или его часть), его зачастую нельзя изменить, убрав все факторы, кроме самого главного. В этом случае распределение измеряемой величины, скорее всего, не будет нормальным, а форма распределения будет определяться физикой вызывающих отклонение процессов.

Пример:

Вы измеряете предельную нагрузку на некоторую деталь. Процесс изготовления детали таков, что с небольшой вероятностью в ней образуются микротрещины. Если микротрещины возникают в области, на которую приходится основная нагрузка, деталь ломается при относительно небольшой нагрузке. В результате у вас иногда деталь будет ломаться при небольшой нагрузке (если попадается деталь с трещинкой в критически важной области) (красные столбцы на рис. 4), но в большей части случаев при нагрузке, соответствующее прочности однородного (не дефектного) материала (синие столбцы на рис. 4).

Возникает распределение, заметно отличающееся от нормального - оно несимметрично, имеет «хвост» с левой стороны. В таком случае можно оценить математическое ожидание и дисперсию, однако применение формул для нормального распределения (например, правило «трех сигм»), даст неверные результаты. К примеру, оценка вероятности выхода из строя детали при нагрузке ниже заданного уровня около 12 единиц, окажется заниженнной.

Отношение к подобным результатам зависит от целей исследования. Конечно, если физик сталкивается с таким объектом исследования, он попытается минимизировать действие «посторонних» факторов - например, будет стараться «отсеять» детали с трещиной в критически важной области еще на стадии подготовки к эксперименту. Либо, напротив, исследовать только случаи «преждевременной» поломки, если объектом интереса являются эти самые микротрещины.

Однако задача может состоять и в создании адекватного описания технического объекта «как он есть». Да, известно, что технология изготовления несовершенно, но менять ее нецелесообразно (например, по экономическим причинам) - и ставится задача, например, оценить нагрузку, которую выдержит 99,9% деталей. При такой постановке придется работать с тем распределением, которое есть, и которое не описывается нормальным законом.

Рис. 4. Пример распределения вероятности, заметно отличающегося от нормального. Красным показаны случаи поломки детали из-за наличия относительно редких дефектов.

- Когда делаются такие эксперименты, они делаются не для того, чтобы физики что-то получили. Допустим, мы отливаем партию деталей… Сделать так, чтобы все детали были классными, очень трудно.
- Фактически все зависит от цели исследования. Можно сказать заказчику о том, что наличие «хвоста» связано с дефектами производства, и предложить отбраковывать эти детали или улучшить технический процесс. Но задача может быть поставлена так, что технология такая, как есть, и ее нельзя менять. Например, потому что менять технологию долго или дорого. Мы будем жить с такими деталями, которые иногда дефектны. Задача может стоять - выяснить нагрузку, которую выдержат 99,9%. Вы ее определите, и производитель просто снизит декларируемую предельную нагрузку, и будет спокойно эти детали продавать.
- Еще может быть, что детали используются вместе, и предел разрушения одной гораздо больше, чем другой. И нет смысла повышать предел разрушения первой.
- Да, может быть много причин. В любом случае, важно определить цель исследования. Если необходимо изучать объект, как он есть - придется работать с тем распределением, которое есть. С другой стороны, иногда цель поисковая ¬- например, выяснить, какую предельную прочность можно достигнуть, если усовершенствовать технологию.
Важно то, что для реальных технических объектов часто будут встречаться распределения, отличные от нормальных. Потому что случайные факторы генерируются несколькими процессами.
- Т.е. распределение будет суммой нескольких нормальных распределений?
- Нет, совсем не обязательно. Даже один физический процесс, лежащий в основе отклонений, которые мы описываем как случайные, совсем не обязательно имеет нормальное распределение.

наука, много букв