Есть подозрение, что в
bootstrap-семплировании для некоторых статистик можно избежать собственно семлирования, честно по формуле посчитав мат-ожидание результата или [2.5%, 97.5%] интервал распределения результата.
Выборка с возвращением в bootstrap - это тоже самое что и семплирование из
эмпирического распределения выборкиобозначим эту эмпирическую функцию распределения как F̂
применим F̂-1 к равномерно распределённой на [0, 1] величине U(0,1), получим снова распределение F̂
Чтобы создать одну bootstrap-выборку - можно взять выборку из n штук из U(0, 1) чисел и применить к ним F̂-1
медиана bootstrap-выборки - это применение F̂-1 к i-й порядковой статистике, где i равно n/2.
i-я порядковая статистика U(0, 1) -
это вдоль и поперёк изученное
бета-распределениеБерем это бета-распределение, берем его [2.5%, 97.5%] интервал распределения (через неполную бета-функцию или приближение нормальным распределением), втыкаем его границы в F̂-1, получаем интервал в котором (97.5% - 2.5%) будет bootstrap-медиана
Таким же образом можно получать остальные квантили, не только медиану.
Велосипед? Или грабли? Или это настолько очевидно, что так всегда и делается?