Итак, появилось у меня немного времени и решил я закрыть старый гештальт. Провести научное исследование, с такой вот гипотезой. Имя влияет на профессию.
Никаких подобных исследований я не нашел, поэтому начал копать сам. И лажанулся уже на первом шаге. Так как доступа к данным "министерства труда" или чего там такого у меня нет, я выбрал самый очевидный доступный источник данных. Данные брал из википедии.
И тут же меня постиг Первый инсайт. В википедии - только известные люди, а не все люди. И там совсем нет профессий. Ладно, тогда формулировка гипотезы резко меняется. Исследование, как имя влияет на вид деятельности, который в принципе описывается в Википедии. Так что это исследование русскоязычного понятия "популярность". Категоризация, конечно, дело совершенно неблагодарное, и вопрос больше искусства и шедевра, нежели строгости. Так что я долго примерялся и читал сотни определений "персоналий". И вот тут - первые данные. Основные категории, которые встречаются (больше 1000 человек):
Второй инсайт. "Известные женщины" - это исключение. Даже самое популярное имя, "Мария" встречается всего 755 раз. Что не дотягивало до моей планки в 1000 человек. Представляете? Сначала меня это возмутило, но потом я отошел и расслабился. Все хорошо, так и должно быть. "Известность", ишь ты... Итак, дальше в забеге продолжали участвовать всего 24 мужских имени,
И тут меня постиг Третий инсайт. Популярность имен - совершенно нестабильная вещь. Подробно про это, оказывается, уже
много писали. Но я и не думал, что так все быстро происходит от поколения к поколению. За 50 лет популярность может полностью перевернуться. Поэтому все мои гипотезы по-хорошему должны учитывать дату рождения, но так как у меня и так мозг уже взрывался от цифр и кода, который я писал чтобы это все добывать, то я забил. Пусть будет некий Исторический Срез текущей русскоязычной википедии. Как отражение культуры, то есть суммы всех идей и человеческой памяти. Так я ввел категорию "Герой Труда", в которой вписаны все Герои Советского союза. Независимо от их масти и достоинств. А все "профессии" в действительности поместились внутрь понятия "специалист". Итак, в Википедии больше всего информации про людей всего двух типов. Участники Второй Мировой и разнообразные деятели революции. "Содействовал победе коммунистической партии в городе Запупинске". "Воевал с Деникиным". "Прапорщик NNN-ской дивизии". Грустно, и захотелось немного посравнивать с англоязычной википедией. И это тема для совсем другого исследования.
Ну вот и время для Четвертого инсайта с Картинками. Все же, несмотря на все смены парадигм и притянутость за уши, какое-то количество слишком-заметных-отклонений найдено. Смотрите сами, а мои маленькие выводы - это результат рассматривания картинок.
- Имя "Анатолий" видимо было совершенно непопулярно в 40х, и оттого военными Толики не бывают.
- Андреи заметно мощны в спорте: 22% всех Андреев в википедии - это спортсмены!
- Борисы - ученые и писатели. А вот кстати спортсмены из них никудышные
- Вася, Ваня, Федор, Пётр. О ужас, как это было популярно в начале 20 века.. Сплошные революционеры и военные. И, видимо, выглядело "близко к народу" и "патриотично" - поэтому пропаганда их сделала популярными.
- Виктор, Дмитрий, Евгений. Тоже блин спорт.
- Георгий. Поразил тем, что по всем показателям близок к средним значениям. Поздравляю, поздравляю...
- Григорий. То же что Иван, но почему-то со спортом и просветительством совершенно не дружит )
- Игорь - кроме спорта, еще и очень артистическое имя
- Николай. Уф, только в спорте подкачал
- Леониды - писатели. Странно, так, сходу - не могу назвать ни одного
- Сергей. Вот это я не думал, что это имя было совершенно не в ходу в революцию и войну. Зато в спорте их опять ))))
Вот вам для ознакомления все картинки ) дальше прошу самостоятельно выуживать данные.
Выводы. Кроме инсайтов по факту, есть много-много счастья от того, что я сделал Идиотскую Ненужную Штуковину. Мой вклад в Человечество )))))))))))))). Так что не бойтесь потерять массу времени на непонятно что. Это тоже вид правильного действия. :)
P.S. 3 дня. 21 кб кода. 78,428 обработанных записи.