Leave a comment

riftsh September 15 2006, 14:43:01 UTC
Да, я выше говорил, что не совсем тривиальна, но в то же время вполне решаема на достаточно строгом уровне. Один из возможных алгоритмов легче всего объяснить на примере. Допустим у нас есть два литературных описания ресторана. Разумеется, между ними есть некоторое сходство, и мы хотим проверить случайно ли оно. Для этого мы выбираем из мировой литературы все известные нам описания ресторанов (если их слишком много, делаем случайную или репрезентативную выборку из, например, 100 описаний). Составляем из этих 100 описаний ресторана все возможные пары. Получим (100 х 99) / 2 = 4950 таких пар. Теперь для каждой пары рассчитываем величину оценочной функции сходства (similarity scoring function - я не уверен в правильности моей русской терминологии). Оценочная функция состоит из нескольких компонентов. Так, например, за совпадение слова в обоих описаниях данной пары дается некоторое количество очков. Это количество тем больше, чем реже данное слово встречается во всех 100 описаниях. В нашем примере, совпадение слова "суп", "вилка" или " ( ... )

Reply

Я нисколько не против lev_m September 15 2006, 15:11:02 UTC
Алгоритм вызывает доверие :) Хотя и технические трудности, мне кажется, возникнут немалые. Ну, и теоретические - что мы отнесем к "мировой литературе"? Егор Исаев войдет?
А если мы сравниваем описание ресторана с описанием новой модели гоночного автомобиля? Это не абсурдный пример - вспомните Виана.
Так что поневоле приходится "на глазок", а тут уж оценка сильно зависит от багажа оценщика.

Вот я подброшу парочку примеров (автор - не я!), оцените.
1 - К песне "Балтийские волны" (1993 ( ... )

Reply

Re: Я нисколько не против riftsh September 15 2006, 16:12:41 UTC
Егор Исаев войдет?

Конечно войдет. Ведь здесь мы измеряем фон. Вопрос о критериях отбора образцов как раз не очень сложен. Тяжелее с выбором формы и настройкой параметров оценочной функции.

Ваши два примера из немножко другой категории, но и в ней можно пытаться квантифицировать.

А багаж оценщика играет роль, да. Потому что, утверждение о том, что Кукин лучше Щербакова невозможно оспорить, ни качественно, ни количественно.

Reply

Re: Я нисколько не против amigofriend September 15 2006, 22:22:22 UTC
Те же. Входит Егор Исаев.
:)

Reply


Leave a comment

Up