или про что была моя диссертация
Классическая математическая статистика, изучаемая в вузах, работает с фиксированным объемом выборки. Это означает, что нам дано n наблюдений, и по ним мы должны сделать какой-то вывод. Например, у нас есть 100 наблюдений, среднее арифметическое которых равно 0.55. Из этого нельзя делать вывод, что настоящее среднее того закона, который мы наблюдаем, в действительности равно 0.55. Что можно - это, например, проверить гипотезу о том, что настоящее среднее равно 0.5, при альтернативе, что оно больше 0.5. Используя тот или иной статистический критерий, мы делаем вывод: "да, гипотеза верна, истинное среднее равно 0.5" или "нет, верна альтернатива, истинное среднее больше 0.5".
А теперь представим, что наблюдения к нам поступают не разом 100 штук, а по одному. Мы, конечно, можем дождаться, когда их накопится 100 штук, и далее рассудить, как если бы у нас была выборка фиксированного объема 100. Но часто бывает так, что вывод о справедливости гипотезы можно сделать, не дожидаясь, пока пройдут все 100 наблюдений. Иногда данные достаточно красноречиво свидетельствуют в пользу гипотезы или альтернативы уже на 50 наблюдениях, иногда - на 75 наблюдениях, все 100 наблюдений нам в большинстве случаев проводить необязательно. Такой последовательный подход позволяет сэкономить на излишних наблюдениях, которые требуют лишних времени, сил, средств и т.д. Возникает вопрос о том, как правильно выбрать момент прекращения наблюдений, чтобы экономия была не в ущерб точности, и какое решение (действительно ли среднее 0.5 или оно больше?) в итоге следует принять.
Этот вопрос в 1975 году рассмотрел Р. Берк в своей статье в "Анналах статистики". Он указал процедуру выбора момента остановки эксперимента и правила принятия решения для гипотезы "равно тому-то" и альтернативы "больше того же самого" в случае, когда наблюдения независимы и одинаково распределены. Что делать в случае зависимых или хотя бы разнораспределенных наблюдений (например, в случае всеми любимого марковского процесса) до наших с Андреем Алексеевичем работ было неясно. Все, конечно, могли догадываться, как будет выглядеть наилучшая процедура, но строгого математического доказательства не было.
В наших с Андреем Алексеевичем работах (и соответственно, моей диссертации) описана процедура выбора момента прекращения наблюдения и правила принятия решения в последовательной постановке при гипотезе и альтернативе вида "равно/больше" (или "равно/меньше") для наблюдений, которые в общем случае могут быть зависимыми и неодинаково распределенными. Доказано, что такая процедура будет наилучшей из всех возможных. Можно сказать, решение поставленной задачи получилось исчерпывающим. Результаты Р. Берка получаются из наших работ как частный случай, и более того, наши результаты получаются при условиях более слабых, чем в работе Р. Берка.
[1] Berk R. H. Locally most powerful sequential tests. Ann. Stat. - 3. - 1975. - P. 373-381.
[2] Novikov A., Novikov P. Locally most powerful sequential tests of a simple hypothesis vs. one-sided alternatives. J. Stat. Plann. Inference. - 2010. - Vol. 140(3). - P. 750-765.
arxiv.org/abs/0905.1437.
[3] Новиков П. А. Локально наиболее мощные последовательные критерии для марковских процессов с дискретным временем. Теор. вероят. прим. - 2010. - т. 55(2). - с. 369-372.
[4] Новиков А. А., Новиков П. А. Локально наиболее мощные последовательные критерии проверки простых гипотез против односторонних альтернатив для независимых наблюдений. Теор. вероят. прим. - 2011. - т. 56(3). - с. 449-477.
arxiv.org/abs/1004.4391v1.