Понадобилось тут в работе с медиками посчитать стандартное отклонение по выборке, если известны параметры (объемы, средние, стандартные отклонения) составляющих ее частей - или, другими словами, посчитать стандартное отклонение объединенной выборки. С объемом-то и средним это считается легко, а вот что со стандартным отклонением? Я исходно не был на 100% уверен, что это вообще можно посчитать - однако оказалось, что можно!
Нашел
ответ на CrossValidated.
Как и ожидалось, в общем-то, формула рассчитывает не стандартное отклонение напрямую, а дисперсию:
Ссылка была на относительно свежую, шестилетней давности,
статью в The American Scientist.
Правда, проглядев ее, засомневался - там вообще-то идет речь о двух выборках их одной совокупности, а где-то и вообще используется предположение о большой выборке - но, как оказалось, на интересующий меня результат это не распространяется.
Для уверенности даже перевывел его на бумаге - в статье все ходы записаны, но моим мозгам с непривычки (ну или с отвычки) было трудно разобраться в доказательстве "с листа", да и нотация там немного другая.
Как там, доказательство - это рассуждение, убеждающее в правоте некоторого утверждения? Да, убеждает.
Преподавал бы статистику не биологам - давал бы такую задачку.