о внутренней оценке шахматной позиции

Apr 14, 2019 15:57

Я в последнее время много размышляю о шахматах особенно в свете продолжающего прогресса силы шахматных движков (причем как стандартных так и нейронных), которые достигли уже 3600 рейтинга (такой рейтинг можно корректно померить только играя с программами более низкого рейтинга, поскольку белковый чемпион мира проиграет все встречи и движку с ( Read more... )

deep learning, chess

Leave a comment

akor168 April 15 2019, 09:13:51 UTC
Да, насколько я понял это я было одно из ноу-хау Стокфиша - тонкая настройка оценочной функции. Но, то что у нейронок общая оценка позиции сильнее это признают даже их противники. Стокфиш просто считает в тысячу больше позиций (потому что просчет через нейросеть сильно дольше), но оценочная позиция у него хуже, ибо она базируется на эмпириках с наигранными гипер-параметрами.

А с монте-карло и альфа-бета там смешно. Сейчас вот в первом дивизионе со стокфишем, лилой играют две версии Комодо. Одна на альфа-бета, а другая на монте-карло, и вторая играет даже чуть лучше. При этом никакой нейронки - монте-карло навесили над обычным движком и получили прогресс. А вот прокрутить альфа-бета к нейронке это одна из идей, но пока таких реализаций нет. Причина в том, что вычисление оценки позиции через нейросеть на три порядка медленнее даже на видеокартах. Вот если бы получить оценку того же качества что у нейросетей, но которое было бы сравнимо по скорости с обычными оценками. Тогда такой движок бы сохранил бы позиционную силу нейронок и видение тактики стокфиша.

Reply


Leave a comment

Up