Некоторое время назад корпорация GOOGLE оцифровала более 5 миллионов книг на разных языках мира. Для работы с этой огромной библиотекой есть очень удобный инструмент анализа, позволяющий наглядно увидеть частоту употребления слов и целых фраз по годам и провести сравнение с другими словами и фразами. Вот ссылка на этот инструмент -
https://books.google.com/ngrams/ Кстати, именно в этой библиотеке отсканированных книг, с последующим машинным распознаванием и переводом их в текстовый вид, всегда отыскиваются довольно много остатков. Скажу сразу, я не знаю состав этой библиотеки, точное количество оцифрованных на русском языке книг и т.д., но очевидно, что объём существенный и полученным результатам стоит скорее доверять, чем не доверять. Я решил проверить как все работает во временном плане и в привязке к известным историческим событиям. Вот, например, слово «бомбардировщик» -
Все вроде правильно и наши представления и исторические события. Совсем немного упоминаний появилось во времена первой мировой войны. Пик употребления приходится на ВОВ.
А теперь термин «подводная лодка» -
Встречается где-то с 1840 года. С началом первой мировой значительное увеличение и пик во времена ВОВ. С имеющимися у меня представлениями о технической/технологической истории тоже полное совпадение.
Далее я решил посмотреть по этой методике некоторые известные манделы. И начал с Барбары Стрэйзанд, которая теперь совсем не Барбара, а Барбра -
Родилась Барбра (брррр...) в 1942 году. Синий график показывает «Barbara» и как раз на сороковые-пятидесятые годы приходится период популярности этого имени. «Barbra» (красная линия) за все время чуть-чуть отлична от нуля. Все может быть, но это противоречит нашей памяти и, как бы сказал один из моих постоянных оппонентов, «всеобщему бессознательному».
Попытка построить для русского языка (Барбара-Барбра) такой же сравнительный график была обречена на неудачу. Ну не упоминается вообще в русской литературе имя «Барбра».
Много мандел связано с творчеством А.С. Пушкина и М.Ю. Лермонтова. Посмотрим, а как часто они упоминаются в этой реальности -
Пушкин - синий график, Лермонтов - красный. Пушкин, конечно, «наше всё» и график это показывает. Есть некая странность, Лермонтов начинает упоминаться в литературе раньше Пушкина, с начала 1830-х. Пушкин - только после смерти в 1837 году. С 1860 по 1880 практически полное забвение Лермонтова.
Теперь «казус» с двумя «Узниками». В памяти «Сижу за решеткой в темнице...» написал Лермонтов, а вот гораздо менее известное стихотворение (я вообще его услышал впервые совсем недавно, а ведь должен бы знать, и далее я объясню почему)«Отворите мне темницу...» как говорят, вроде Пушкин. Посмотрим -
Синий - «Сижу за решеткой...», красный - «Отворите мне темницу...». На этом графике для меня много странного.
1. Известнейшее стихотворение «Сижу за решеткой...» стало активно упоминаться только с начала 1920-х годов.
2. В то же время, «Отворите...» с 1880-х было весьма популярно.
3. Примерно с 1960 - 1980 (максимум - 1970 год) частота упоминания «Отворите...» в несколько раз выше, чем «Сижу...». Все кто учился в школе в эти годы должны были знать и учить это стихотворение. А вот почему-то учили «Сижу за решеткой»...
Любой график можно объяснить. Это как с Ландау, когда его в коридоре поймал аспирант и попросил объяснить график, тот быстро и доказательно это сделал. А когда аспирант спохватившись сказал, что график то он подсунул нечаянно вверх ногами, Ландау также быстро и доказательно все объяснил.
Теперь пару мандел, который впервые отметил автор этих строк. В известной пьесе Э.Рязанова и Э. Брагинского «Сослуживцы» (1971 год) главная героиня говорит фразу - «Затем проследите за установкой компьютеров в отделе торговли». В фильме «Служебный роман» (1977 год) эта фраза тоже звучит, только по-моему отдел поменялся на строительный, а компьютеры остались. Так вот, это невозможно как по физическим причинам (одна ЭВМ занимала тогда десятки квадратных метров) так и по лингвистическим. Следующий график это наглядно показывает -
В 1971 году (да и в 1977 году тоже) слово «компьютер» (синий график) в СССР практически не употреблялось. Все говорили - ЭВМ. С середины 1980-х трактор компьютер стал вытеснять лошадку ЭВМ.
Еще одна моя почти личная мандела (хотя у меня есть и заединщики) это имя отрицательной героини в книге и в фильме по повести Виталия Губарева «Королевство кривых зеркал». Гадина (Анидаг) или Гадюка (Акюдаг).
С 1950-го по 1980-й эти два слова встречались в литературе почти с одинаковой частотой. В 50-х годах «гадюка» (красная линия) встречается даже немного чаще, чем «гадина». А именно в это время Губарев и написал свою повесть. График наглядно показывает борьбу «гадюки» с «гадиной»...
Думаю, что этот инструмент полезен для тех, кто «доверяет, но проверяет».
Пусть это будет моим скромным вкладом и подспорьем тем, кто не знает чем заняться оказавшись на карантине или в добровольной самоизоляции.