Обработаем вашу выборку стандартной для точных наук математикой.
Нулевая гипотеза: "между решением о начале войны и её результатом нет никакой связи".
Тогда если у нас есть корзина с бесконечным количеством войн, и мы выдернули из нее 48, вероятность того, что среди них победой инициатора закончилось k, определяется биномиальным распределением.
Считаем p-value для получения буквального ответа на вопрос: если предположить, что я живу в мире, где верна нулевая гипотеза, насколько вероятно, что для другой выборки эксперимент даст значение, по крайней мере, столь же экстремальное, как сейчас получено? Это принятый в современной науке ответ на ваш вопрос, где начинается "сильно".
Нас интересует левостороннее p-value, которое буквально равно кумулятивной функции в точке. Берем питон и пишем скрипт, который просуммирует нам биноминальное распределение до 19-ти включительно.
import math
totalEvents = 48
maxSuccesses = 19
cumulativeProbability = 0
for k in range(0, maxSuccesses+1):
p = pow(0.5, totalEvents) * math.factorial(totalEvents) / (math.factorial(totalEvents - k)*math.factorial(k))
cumulativeProbability += p
print(cumulativeProbability)
p-value 0.09670632643096866
Наиболее распространенный порог значимости 0.05.
Результат не является статистически значимым. Недостаточно доказательств, чтобы отвергнуть нулевую гипотезу.
Теперь ваш первый массив. 42 победы инициатора из 61 войны. Скрипт тот же, но ветка правая, так что, нас интересует (1 - cumulativeProbability)
p-value 0.0009340505154875611
Результат является статистически значимым. Мы можем отвергнуть нулевую гипотезу и принять альтернативную. И это, на самом деле, уже серьезная математика, т.к. увидеть такое хорошее p-value на выборке исторических событий, каждое из которых сложное и уникальное, - мягко говоря, неожиданно.
Шутки ради, берем выборку kim_noir
p-value 0.2265625
Что тут сказать?
В общем, правильная интерпретация вашей статистики: До ВМВ политики скорее понимали, что такое война. А потом вполне могли утратить это понимание. Но вполне могли и не утратить. Слишком малая выборка.
Обсуждение
Было бы соблазнительно сказать, что это хорошо согласуется по времени с принципиальной трансформацией международных отношений в сторону их усложнения. Но выборка 1946-2003 не дает такой возможности. Однако, если смягчить требование, и зачитывать в пользу инициатора те случаи, когда война не закончилась чистым поражением, то p-value = 7.610913055344781e-06
Получается, что между решением о начале войны и не-поражением в ней таки есть связь. И мы можем утверждать, что политики в периоде 1946-2003 еще недостаточно извращенно понимают войну, чтобы ввязываться в заведомо проигрышные авантюры. Для этого тезиса статистики достаточно.
для людей без предубеждения по обсуждаемому вопросу эти данные, полагаю, станут полезной пищей для размышлений. Убеждённых же они, как водится, сильно укрепят в вере.
Посмотреть обсуждение, содержащее этот комментарий