Несколько комментаторов к прошлой записи справедливо указали мне на ошибку. Криминальность группы нужно измерять не как разность между долей группы среди преступников и долей в населении, а как отношение этих долей. Согласен. Но можно и проще: как долю преступников в данной группе.
В
моём источнике нет разбивки по странам, а только по группам
(
Read more... )
Comments 17
Система категоризации Живого Журнала посчитала, что вашу запись можно отнести к категориям: Криминал, Общество.
Если вы считаете, что система ошиблась - напишите об этом в ответе на этот комментарий. Ваша обратная связь поможет сделать систему точнее.
Фрэнк,
команда ЖЖ.
Reply
Мне кажется, если объяснять семь точек тремя факторами, то факторы можно взять почти любые и все равно сработает более-менее точно. Вот если бы точек было семьдесят семь, а фактора три, тогда можно поверить.
Reply
Да, конечно. Тем более что точек даже не 7, а 6. Но увы, разбивки по отдельным странам нет.
Reply
А попробуйте построить наоборот. Например, оценить доход как функцию от безработицы, криминальности и доли молодых.
Или безработицу как функцию от доли молодых, криминальности и дохода. Может быть, если люди подозревают, что высокие доходы им не светят, они тогда и работу не так активно ищут.
Да и регрессия, где доля молодых - функция от безработицы, криминальности и дохода, тоже может оказаться с высоким R^2. Ведь в бедных, безработных и криминальных сообществах высокая фертильность, поэтому много молодежи. А еще там люди живут не так долго, а кто доживает до старости, не мигрирует.
Если не получится с сырыми данными хороших регрессий, можно попробовать с натуральными логарифмами от значений. Это считается нормальным в авторитетных экономических журналах.
Ну а самое интересное, наверное, это почему некоторые сообщества такие молодые, бедные и безработные. Не коррелируют ли эти признаки с какими-нибудь особенностями общественного мнения в данных группах, например.
Reply
Если все эти переменные линейно связаны, то, конечно, везде будет хорошая регрессия, без разницы, что взять за независимые переменные.
По хорошему надо считать с лагом. Брать независимые переменные, например, за 2022 год, а целевую за 2023. И вообще побольше взять серии по времени. Поднять отчёты за прошлые годы. Надо попробовать, когда будет время.
Reply
Три подгоночных параметра на 6 экспериментальных точек? Мало данных. "Дайте мне четыре параметров, и я нарисую вам слона. Дайте пятый, и он станет махать хоботом".
Reply
( ... )
Reply
Это как раз взаимосвязано. Говорят, на каких-то итальянских островах, где правит мафия, уличная преступность вообще нулевая.
Reply
Наиболее напрашивающееся объяснение - дети и жены мелких мафиози живут в тех же домах, ходят по тем же улицам и учатся в тех же школах. А мафии уличную преступность гораздо проще, чем госмашине, либо ликвидировать, либо рекрутировать на гораздо более серьезные дела.
Reply
Leave a comment