imdb scoring

Jun 17, 2017 17:07

Смотрел недавно статистику своих оценок на кинобазе, чтобы понять, как я ставлю оценки по сравнению с популяцией. Вот такая картинка получилась (по примерно 700 фильмам - конечно, я оценил далеко не всё, что посмотрел):

минимумсреднеемаксимум
Моя оценка1.05.910.0
Популяционная оценка3.47.49.7

Т.е. я использую всю ширину шкалы и средний балл у меня всего на балл выше 5, теоретической середины, а вот публика избегает ставить низкие оценки и фактическая серединка задрана вверх. Почему? Одно из двух:
(1) либо люди не желают обижать авторов
(2) либо они смотрят только хорошие фильмы, "рекомендованные" другими

Далее, посмотрел корреляции между этими оценками и некоторыми другими параметрами, в частности, продолжительностью фильма, годом выпуска, и числом оценок. Получилось вот что:

Поп.оценкаПродолж.Год выпускаЧисло оценок
Моя оценка+.39+.05-.12+.14
Популяционная оценка+.16-.23+.40
Продолжительность-.03+.13
Год выпуска+.28

Какие выводы:
* корреляция между моими и популяционными оценками (+0.39) свидетельствует, что мне нравится то, что нравится публике; нежёстко, но в целом да
* корреляция между поп.оценками и их числом (+0.40) свидетельствует в пользу гипотезы (2), т.е. что смотрят все, плохим быть не может;
* мои же оценки с количеством просмотров связаны слабо (+0.14), т.е. редкие, незамеченные фильмы мне тоже могут понравиться, а популярные блокбастеры - наоборот; я могу поставить кол и номинанту, и лауреату Оскара;
* народ считает, что раньше фильмы были лучше (корреляция с годом выпуска -0.23); я частично с ними согласен (-0.12);
* люди ставят чуть более высокие оценки продолжительным картинам (+0.16); я практически не разделяю этого мнения (+0.05);
* люди смотрели больше недавних, чем старых фильмов (+0.28), ну, это очевидно.

This entry was originally posted at dreamwidth.org

imdb, statistics, movies

Previous post Next post
Up