50 лет данных в bigquery

Oct 19, 2018 19:00

В гугловском облаке можно поиграть с данными в платформе для аналитики BigQuery. Там есть данные по рождаемости в США за последние 50 лет.

И вот тут можно посмотреть средний возраст родителя, когда у него рождается первый ребёнок. Детей заводят позже, это меня не удивляет. А вот разница в возрасте между средним отцом и средней матерью меня несколько обескуражила. Средней матери было 21 раньше и 25 в 2008 году. А среднему отцу было 35, а стало 39. Откуда такая огромная разница? Я думала, разница будет лет пять, а не почти 15.



А вот тут ещё я сделала картинку, сколько из этих девиц было замужем. Тут не очень понятно как интерпретировать, потому что про очень многих до 80 года мы не знаем их статуса, а потом, видимо статистику подправили. Судя по тому, как изменяется график потом, "неизвестные" имеют более менее такое же распределение с несколько большей склонностью к тому, чтобы не быть замужем, как и известные. Потому что после 80 идет стабильная прибыль незамужних, В 2007 незамужних уже больше трети.



В общем, заводить детей вне брака и заводить их поздно более принято (в США), чем я думала.

data science

Previous post
Up