Пишу уже второму клиенту "Рекомендации по стратегии развития XXX" и понимаю, что важнейший в этих рекомендациях пункт будет недооценен и поэтому имеет все шансы быть не выполненным. Речь идёт об использовании глубоких нейронных сетей. Где? Ответ: везде. Как? Ответ: очень по-разному
(
Read more... )
Вообще, прога не на уровне гроссмейстера играет, а на уровне International Master - рейтинг Elo 2400. У самых крутых програм оценка Elo рейтинга - 3200-3300, а это круче чем гроссмейстеры. На самом деле, эта прога очень далеко по крутости игры от топовых программ, но она интересна другим.
Ну и кагбэ 72 часа тренили одну оценочную функцию, а не прогу научили играть в шахматы - тут вообще понятие научили становится довольно муным.
Вообще, цель работы была чтобы прога сама научилась, и фишка как раз в том, что она училась, делая предсказания оценки позиции и корректируя их на основе будущих более точных оценок.
Под "сама научилась" аффтар имеет в виду что функция оценки позиции на основе более-менее стандартных низкоуровневых фич, ну и более высокоуровневые фичи были выучены с помощью дип лёрнинга (а не hand-crafted опытными программистами-шахматистами, как обычно).
Вобщем, если внимательно работу почитать, то совсем другое впечатление - да, студент молодец, реализовал несколько интересных вещей и, безусловно, новацию в компьютерных шахматах. Но мир в очередной раз не перевернулся. Hand-crafted фичи пока еще покруче и побыстрее.
Reply
Leave a comment