Задача

Nov 12, 2015 15:58

Придумал простую задачку ( Read more... )

Leave a comment

shurik_s November 12 2015, 23:12:27 UTC
Я, как и большинство, с первого раза прочитал эту задачу неправильно.

Но мне стало интересно немного другое. В твоем и Сережином варианте, от разницы в силе игры ничего не зависит. И это меня огорчает. Хочется добавить условие, чтобы для каждой заданной вероятности p<75% существовал игрок D проигрывающий игроку А с вероятностью p.

Это заметно все усложняет, но дает другой интересный срез. Если сила игрока определяется одним числом, а вероятность победы определяется непрерывной строго монотонной функцией от разности, то достаточно очевидно, что такого не бывает.

Осмысленным классом функций представляется непрерывная функция f(x,y) строго возрастающая по x, при любом фиксированном y, и строго убывающая по y при любом фиксированном x. Супремум и инфинум должны быть равны 1 и 0 соответственно и f(x,y) = 1 - f(y,x). Тут менее очевидно, но тоже кажется ситуация описанная выше невозможна.

Раз при одном параметре характеризующем силу такое не возможно, то у нас остается попробовать характеризовать силу большим количеством чисел. Например, для тех же шахмат, можно считать, что у человека есть умение играть белыми (w_i) и умение играть черными (b_i). Вероятность победить в партии это 1/2 *f(w_i,b_j) + 1/2 *f(b_i,w_j), если вероятность играть за белых и черных одинаковая.

Например, для f(x,y)=x/(x+y) у меня не получилось сходу найти решение для 75%, возможно его нету, но решение существует если 75% везде заменить на 60%. Как я понимаю, принципиально это сути задачи не меняет.

Ну а теперь главный вопрос, а есть ли такая f(x,y), для которой в описанной ситуации будут существовать решения для любой вероятности из диапазона [50%, 100%].

Reply

nikolenko November 13 2015, 05:28:28 UTC
Я тут главное, чего не понимаю, -- это мотивации. :)

Умение играть белыми и чёрными разделить, безусловно, было бы хорошо, но мы же будем знать заранее, кто чем играет, и в твоей модели это всё равно что просто два разных игрока.

В том же ЧГК, с другой стороны, можно придумать латентные факторы у вопроса, которые бог знает что значат и бог знает чему равны, но тогда это, наверное, совсем другая модель получится.

Reply

shurik_s November 13 2015, 07:47:01 UTC
Ну в описанном мной варианте, это действительно два независимых человека, но можно говорить о общем рейтинге и поправке на белость. Тогда победа за черных повышает и рейтинг в игре за белых.
А так да, я просто пришел к тому что хочется придумать хорошие функции вычисляющие вероятности по рейтингам. Ну то есть, что у нас будет хорошо учится и предсказывать.
То есть я пытаюсь придумать преобразование вроде probit или logit которое даст удобную регрессию. :-)

Reply

nikolenko November 13 2015, 08:27:47 UTC
О поправке на белость говорят в моделях Брэдли-Терри, например.

Reply

eterevsky November 13 2015, 06:50:59 UTC
Вообще говоря, с точки зрения игр никаких гарантий строгой монотонности, мне кажется, нет. Легко можно представить себе игру в которой есть три стратегии A, B и C, такие что A выигрывает у B и C вероятностью x, и B тоже выигрывает у C с вероятностью x. Те самые камень-ножницы-бумага с правильно подобранными вероятностями, про которые писали другие комментаторы -- вполне подходят.

Вполне возможно силу игры определять не числом, а вектором. И этот вектор даже вполне можно эффективно искать аналогично рейтингу из следующего поста. И скорее всего, даже если не получится придумать решение с одномерным рейтингом, оно найдётся с многомерным.

Reply

shurik_s November 13 2015, 07:40:44 UTC
Идея монотонности возникает из следующих соображений, если у нас есть вектор описывающий рейтинги игроков, то если рейтинги игроков A и B отличаются в одной позиции и на этой позиции рейтинг A больше, то вероятность что A победит C должна быть больше чем вероятность, что B победит C. Иначе теряется смысл называть это рейтингом. Единственный момент когда можно уйти от строгой монотонности, это когда вероятность победы равна 1 или 0. Но я считаю, что таких вероятностей быть не должно ибо мало ли что...

Reply

nikolenko November 13 2015, 08:26:39 UTC
Ну так рейтинг - это всего лишь проекция гораздо более сложного процесса...

Reply

shurik_s November 13 2015, 08:34:29 UTC
Конечно, но мы хотим чтобы эта проекция соответствовала нашему бытовому восприятию. Больше рейтинг - игрок круче.

Reply

nikolenko November 13 2015, 08:42:46 UTC
Ну для крайнего примера можно рассмотреть рейтинг по какому-нибудь пятиборью. Вот там чётко понятно насчёт фич и размерности. :)

Reply

shurik_s November 13 2015, 09:01:27 UTC
В пятиборье особые правила пересчета секунд в очки, что несколько меняет всю ситуацию.
А задача предсказывать время прохождения дистанции выглядит гораздо более сложной чем предсказание порядка на финише.

Reply

nikolenko November 13 2015, 10:19:54 UTC
Нет, она, конечно, проще: у тебя будет ещё информация о времени, там наверняка попроще модель получится. Как у меня в ЧГК с плюсиками.

Reply

eterevsky November 13 2015, 11:03:20 UTC
Вообще для рейтинга достаточно и более слабого условия: что для x > 0 f(x) > 0.5 и f (не строго) монотонна. Это значит, что если рейтинг одного игрока больше рейтинга другого, то он выигрывает с вероятностью больше половины. Условие "псевдо-транзитивности" (что если A играет лучше B, а B лучше С, то A играет сильно лучше C) a priori выполняться вовсе не обязано.

Вот представим себе, скажем, фехтование. Пускай есть два трюка X и Y, которые позволяют выиграть дуэль у человека, который не знает, как от них защищаться с вероятностью, скажем 60%. Пускай A не знает ни одного из них, B знает только X, а C знает и X, и Y. Тогда B может применить против A трюк X, C против B трюк Y, а C против A либо X, либо Y, но лишний трюк не даёт ему дополнительного преимущества. Мне кажется, нормальная модель.

Reply

shurik_s November 13 2015, 11:07:19 UTC
Ну не строгая монотонность усложняет определение оптимальной точки на плато. Очевидно, что это хорошо будет работать для дискретных ситуаций, но тогда f может быть просто ступенчатой.

Reply

eterevsky November 13 2015, 11:16:02 UTC
Дык форму функции f тоже можно оптимизировать относительно predictive power. И она может быть разной для разных игр.

Reply


Leave a comment

Up