Все фильмы и пользователи уже есть в базе. Просто в тестовом наборе есть явный уклон в сторону фильмов, которые вышли сравнительно незадолго до того, как база была сформирована (конец 2005 года).
Нетфликсу известна часть матрицы предпочтений Пользователи x Фильмы, а именно - явно сообщенные пользователями рейтинги (около 100 млн штук). Как легко видеть, эта часть составляет малый процент всей матрицы.
С нами Нетфликс поделился частью этой информации, а часть придержал. Нам предлагается угадать те рейтинги, которые известны только Нетфликсу. Поскольку рейтинги, которые нужно угадывать, выбраны не равномерным распределением, то Нетфликс пошел навстречу участникам, сгенерировав при помощи того же механизма рейтинги из публичной части базы.
> Нетфликс пошел навстречу участникам, сгенерировав при помощи того же > механизма рейтинги из публичной части базы.
Я неточно сформулировал свою мысль. Конечно, Нетфликс не генерирует рейтинги, он их выбирает из публичной части базы. Вся база - это реальные рейтинги, введенные подписчиками Нетфликса. Таким образом, участники могут сравнить свои оценки с точными данными.
(The comment has been removed)
(The comment has been removed)
Reply
(The comment has been removed)
Нетфликсу известна часть матрицы предпочтений Пользователи x Фильмы, а именно - явно сообщенные пользователями рейтинги (около 100 млн штук). Как легко видеть, эта часть составляет малый процент всей матрицы.
С нами Нетфликс поделился частью этой информации, а часть придержал. Нам предлагается угадать те рейтинги, которые известны только Нетфликсу. Поскольку рейтинги, которые нужно угадывать, выбраны не равномерным распределением, то Нетфликс пошел навстречу участникам, сгенерировав при помощи того же механизма рейтинги из публичной части базы.
Reply
(The comment has been removed)
> механизма рейтинги из публичной части базы.
Я неточно сформулировал свою мысль. Конечно, Нетфликс не генерирует рейтинги, он их выбирает из публичной части базы. Вся база - это реальные рейтинги, введенные подписчиками Нетфликса. Таким образом, участники могут сравнить свои оценки с точными данными.
Reply
Leave a comment