Историческая статистика Википедии 1.1. (Методология. Английская Википедия. Выводы.)

Nov 05, 2019 16:33

   Википедия (общедоступная многоязычная универсальная интернет-энциклопедия со свободным контентом) на данный момент накопила большой объем общепринятой исторической информации. Воспользуемся этой базой данных для проведения статистических исследований.
   Статьи по историческим личностям имеют разные категории, в том числе «рожденные» и «умершие» в определенном году и в определенном десятилетии, например:
https://en.wikipedia.org/wiki/Category:1700s_births
https://en.wikipedia.org/wiki/Category:1700s_deaths
   Используя данные категории можно быстро собрать статистическую информацию по годам о количестве рожденных и умерших исторических личностях, занести в табличку Excel и построить графики.
   Births - «рожденные»
   Deaths - «умершие»
   Графики строились по годам и десятилетиям.
   Исторический интервал: 1000 г. до н. э. - 2019 г.

Также рассчитывались параметры:
births+deaths - сумма родившихся и умерших исторических личностей характеризует имеющийся объем исторической информации.
births/deaths - отношение родившихся исторических личностей к умершим (ДК - демографический коэффициент)
Скорость роста исторической информации (СР) - отношение текущих данных к предыдущим.

Исследования начнем с англоязычной википедии, поскольку она самая объемная по количеству статей. Википедия находится с состоянии бурного роста. Сбор информации проводился три раза.
   Январь 2010 г. (было 886000 дат)
   Март 2013 г. (1294000 дат)
   Октябрь 2019 г. (2099000 дат)



Рис.1



Рис. 2

За десять лет объем информации вырос в 2,4 раза.
Несмотря на существенный количественный рост, конфигурация графиков практически не меняется. Следовательно, выбранные критерии для анализа истории в хорошо отражают существующие исторические закономерности.
   Мы получили своеобразный «пульс истории», на котором четко видны крупнейшие исторические события.

Благодаря большому объему статистической информации, конфигурация графиков сохраняет стабильную устойчивость и не зависит от субъективных факторов. Кроме того статистическая информация легко проверяема и может быть собрана любым исследователем буквально в течение одного дня на всем протяжении человеческой истории.

Количество исторических личностей в определенный период теоритически должно коррелироваться с численностью населения. Поэтому тенденции присутствующие на данных графиках можно косвенно отнести и к тенденциям связанным с ростом численности населения Земли.
Посмотрим на динамику роста популяции живых организмов.



Рис. 3

- J-образная кривая 1 отражает экспоненциальный рост численности популяции, который возможен, пока биотический потенциал реализуется полностью;
   - S-образная кривая 2 отражает логистический рост численности популяции. В таких популяциях скорость роста снижается по мере роста плотности популяции.
   До середины ХХ века, для популяции человека, был характерен тип роста близкий к экспоненциальному. То есть, увеличение общей численности населения Земли шло по J-образной экспоненциальной кривой. Но тенденция снижения рождаемости в последние десятилетия для большинства регионов уже очевидна.
   Экспоненциальный рост хорошо просматривается на статистических графиках, последние лет триста, а вот на ранних этапах истории, человечество отказывается вести себя как популяция живых организмов.

Взглянем на график статистики в большом диапазоне 1000-1900 годы.



Рис. 4.

Резкий экспоненциальный рост начинается с XVIII века. На ранних этапах истории мы имеем очень медленный, почти линейный рост исторической информации.
   Большая база данных в XIX-XX веках не позволяет увидеть подробности на ранней стадии истории. Чтобы увидеть целиком весь исторический период поместим график на логарифмической шкале.



Рис. 5

Большие колебания данных по годам затрудняют анализ, чтобы стабилизировать статистику строим графики по десятилетиям.



Рис. 6



Рис. 7

Четкая экспонента XVIII - XX веков превращается в прямую линию. Ранее XVIII века графики нестабильны. На графике можно выделить несколько участков с разной степенью роста исторической информации с приблизительными границами.
   1. 1000 год до н. э. - около 500 г. н. э. Практически линейный рост.
   2. 500-1400 года. Слабовыраженная экспонента.
   3. 1400-1700 года. Экспоненциальный рост со стабилизацией в XVII веке.
   4. 1700-2000 года. Резко выраженная экспонента.
   Данные отрезки можно увидеть на графиках скорости роста и демографического коэффициента.



Рис.8



Рис. 9

Рассмотрим подробнее выделенные временные отрезки.

1. Период 1000 год до н. э. - 500 год н. э.



Рис. 10

Линейная линия тренда удовлетворительно описывает график объема исторической информации. Величина достоверности аппроксимации 0,75.
   Пики на графике смертей отражают исторические события.
- 480 Битва при Фермопилах
- 334 Персидская война Александра Македонского
- 204 Китай, Битва при Пэнчэне
- 84 Правление Суллы
- 40-е годы правление Юлия Цезаря
65 Заговор против Нерона
69 Смута после Нерона
250-е годы. Христианские мученики.
304 Гонения Диоклетиана на христиан.

2. Период 500-1400 г.



Рис. 11

В общем, экспоненциальная линия тренда хорошо описывает график. Величина достоверности аппроксимации 0,96. Хотя участок 500-1000 годов ближе к линейному. Объем информации уже достаточен и пики исторических событий выражены не столь ярко. Линия смертей выше линии рождений, поскольку у многих исторических персонажей дата рождения отсутствует.

3. Период 1400-1700 г.



Рис. 12

Начиная с середины XV века скорость роста исторической информации увеличивается. Линия рождений становится выше линии смертей. Но в XVII веке происходит какой-то сбой, появляется пузырь на линии рождений, а затем на линии смерти. Обе линии прекращают рост, переходят в горизонталь. Данную флуктуацию обсудим чуть ниже.

4. Период 1700-1900 г.



Рис. 13

Период XVIII-XIX веков хорошо аппроксимируется экспонентой. Коэффициент достоверности аппроксимации почти 0,99. Скорость роста исторической информации и демографический коэффициент резко увеличиваются. (см. Рис. 8, 9. )

Уточним дату перехода на экспаненту.



Рис. 14

График рождений начинает уходить в отрыв от горизонтали где-то в районе 1715 года. График смертей продолжает некоторое время движение по горизонтали. Экспоненциальный взлет на нем начинается примерно с 1775 года. Расстояние между взлетами около 60 лет - средняя продолжительность жизни. Время активной деятельности исторических личностей, живших между этими датами, приходится на середину XVIII века.
   На графике смертей видны Великая французская революция 1794 год и Наполеоновские войны 1812-1815 года.

Период 1900-1990.



Рис. 15

В XX веке на статистические графики сильное влияние оказало развитие средств массовой информации: кинематограф, радио, телевидение, интернет. Несмотря на это экспоненциальная линия тренда осталась. Коэффициент достоверности аппроксимации 0,99. После 60-х годов видна тенденция на снижение рождаемости.



Рис. 16

На графике умерших исторических личностей видны два максимума, первой и второй мировых войн. Всплеск на графике родившихся в 30-50 годы связан с развитием телевидения, именно тогда рождались выдающиеся артисты театра и кино. Этот всплеск получает отклик на черном графике в 2000-е годы, года артисты начали умирать.
   Следующий взлет в 70-90-е годы, связан с развитием Интернета. Люди, родившиеся в эти годы, теперь заполняют страницы энциклопедии, некоторые не забывают оставить информацию и о себе. Падение после 90-х, тоже понятно, молодежь еще не успела прославиться.

Итак, мы просмотрели статистические данные Википедии по историческим личностям на протяжении 3000 лет. График исторической статистики имеет принципиальный перелом закономерности роста в районе XVIII века.
   До этого перелома рост объема исторической информации идет медленно, имеются области столетних застоев, количество исторических личностей родившихся и умерших приблизительно одинаково, демографический коэффициент колеблется около единицы. Графики родившихся и умерших похожи на две веревки вьющиеся вокруг друг друга.
   В XVIII веке характер графиков резко меняется, вначале линия рождений начинает резкий экспоненциальный рост, через 60 лет линия смертей также начинает экспоненциально расти. При этом графики родившихся и умерших расходятся, демографический коэффициент увеличивается до 3-3,5. Скорость роста исторической информации увеличивается в разы, на нее начинает оказывать влияние демографический фактор. Мы начинаем наблюдать типичный экспоненциальный рост характерный для популяции любых живых организмов.



Рис. 17

Опираясь на данный статистический анализ историю человечества можно условно разделить на два промежутка:

ИСКУССТВЕННАЯ ИСТОРИЯ - написанная официальными историками. Эта история в основном составлена из ограниченного числа исторических списков: правителей, кардиналов, членов парламента, художников, самураев, игроков в крикет и проч. В этой истории отсутствует демографическая динамика, поскольку ее невозможно учесть, при искусственной компоновке исторических материалов. Исторические персонажи являются либо вымышленными литературными героями, либо дубликатами людей живших в более поздний период.

ЕСТЕСТВЕННАЯ ИСТОРИЯ - количество исторических личностей экспоненциально растет, пропорционально количеству населения. Здесь на исторической арене появляются персонажи благодаря своим личным заслугам, а не перу историков. То есть появляется быстро растущий слой реальных исторических личностей, правильно позиционированных на современной календарной шкале.
   Это не означает, что после перелома все исторические личности являются реальными, слой вымышленных персонажей продолжает существовать в XVIII и в XIX веке.
   Причина экспоненциального роста, по-видимому, появление бумаги как носителя информации - первая информационная революция.
   Рост вначале идет за счет второстепенных исторических персонажей: журналистов, артистов, архитекторов, строителей, врачей, бизнесменов, банкиров, садовников, преступников и прочих людей, попавших на страницы книг, газет и журналов.

Теперь вернусь к флуктуации XVII века.



Рис. 18



Рис. 19

Глядя на данного верблюда возникает ощущение, что это искусственная вставка некоего куска информации и более позднего времени. Предположим, что в Европе XIX века имеется две группы стран с различным календарем. Одна часть стран ведет отсчет времени по современному нам календарю, другая часть по своему календарю отличающегося от современного лет на двести. Потом происходит календарная реформа, и вторая группа стран меняет свой календарь на современный. Получается, что большой кусок информации с датированными историческими источниками опускается в прошлое на величину календарного сдвига.
   Попробуем смоделировать ситуацию и отправить персонажей первой половины XIX века в век XIII. Берем всех умерших между 1800 и 1860 годами и прибавляем к умершим в 1200-1260 годы, предварительно поделив на коэффициент 20, для сохранения масштабов. При средней продолжительности жизни 60 лет, эта группа перемещенных лиц должна была родиться в интервале 1740-1800 годов. Берем данные по рожденным в этот период и проделываем ту же процедуру.



Рис. 20

Видим, что наш искусственный имплантат по конфигурации напоминает аномалию XVII века. В случае такого переноса в XIX веке должна появиться недостача фигурантов. Проверяем это.



Рис. 21

Видим, что график смертей в районе 1810-1850 годов провисает под линией экспоненциального тренда. Так, что недостача вполне может быть.
Таким образом, гипотеза о возможном переносе исторических источников в прошлое за счет одновременного наличия в разных регионах несовпадающих календарей имеет право на существование.

В Английской Википедии имеются полные списки членов парламентов, по выборным округам начиная с 1593 года, https://en.wikipedia.org/wiki/List_of_MPs_elected_to_the_English_parliament_in_1593 .
После 1705 года, объединения с Шотландией это списки членов парламента Великобритании, https://en.wikipedia.org/wiki/List_of_MPs_elected_in_the_1708_British_general_election.
После 1801 года, объединения с Ирландией - списки членов парламента Объединённого Королевства, https://en.wikipedia.org/wiki/List_of_MPs_in_the_first_United_Kingdom_Parliament.

Данные списки отсутствуют для парламентов 1747, 1835, 1837, 1841, 1847, 1859, 1865 годов. Изобразим это на гистограмме.

Парламенты Англии и Великобритании по годам.


Пропуск списков в середине XIX века, позволяет предположить перенос их в прошлое.

Previous post Next post
Up