LeelaChess прогрессирует

Mar 17, 2019 22:58

Между прочим, "народная" Альфа-Зеро, называемая ЛилаЧесс, доросла до уровня топ-движков, и уже играет с ними на равных и выигрывает (а до этого заняла второе место в чемпионате мира среди движков после СтокФиша ( Read more... )

deep learning, chess

Leave a comment

Comments 17

freeborn March 18 2019, 00:02:42 UTC
Апдейт прекрасный )

Reply


whiteferz March 18 2019, 07:31:30 UTC
Сомневаюсь. Шипов показывал, как Стокфиш разделал Альфу строго по дебютной книге во французкой защите.

Там Альфа взял пешку, которую по книге брать нельзя.

Reply

akor168 March 18 2019, 10:37:38 UTC
Лила до сих пор маты зевает, играя в остальном на равных со стокфишем. По одной из ссылок в таге Leela в последнем блоге приводится конкретный пример.

Французскую защиту, кстати ни Лила, ни Альфа самостоятельно(то есть когда дебюты не форсируют, а в 1000 игр Альфа-Стокфиш там были тематические блоки, а в чемпионате среди машин они также играют часть пар игр на конкретный дебют по книге) не играет, и возможно поэтому промежуточные версии недостаточно хорошо ее понимают. Но на е4 Лила в свободной игре уже всегда отвечает е5. У Альфа были те же повадки, то есть это не случайность - нейронки остальные варианты считают худшими (и скорее всего так оно и есть).

Reply


ivanov_petrov March 19 2019, 11:38:36 UTC
Я с темой не знаком. Подскажите6 я эти шахматно-сетевые ИИ могут играть в долю силы, как это делается в программах для новичков - ну там вчетверть силы, вполовину и пр.? Чтобы новичку было интересно. Если могут - как это достигается, там же вроде самообучение на полную и нет никакого регулирвоания? Если не могут, это занятно.

Reply

akor168 March 19 2019, 14:16:06 UTC
Это интересный вопрос. Теоретически, это может быть максимально настраиваемо. Но проблема в том, что это надо либо закладывать изначально в процесс обучения, и если этого не сделано, то ее придется учить заново, иначе заложить например чтобы она училась не только выигрывать оптимально сильным ходами, но и поддаваться(если попросят), или делать объективно не лучший ход, но наиболее выигрышный именно против этого соперника(например, жертва некорректна, но слабый игрок не найдет опровержение) . Говоря откровенно одна из моих идей, что таким образом можно даже попробовать натренировать программу, которая одновременно учиться тому как учить людей своему стилю игры(например генерируя признаки позиции которые людям не знают ( ... )

Reply

ivanov_petrov March 19 2019, 16:11:40 UTC
Спасибо, так я и думал. Отдельным обучением с другими параметрами.

Reply

akor168 March 19 2019, 16:29:03 UTC
С другой ЦЕЛЕВОЙ функцией. То есть мы учим не просто выигрывать, а например выигрывать максимально издевательски, или максимально зрелищно, или вообще "кандибобриком". Этого еще никто не делал, поскольку пока все хотят просто научить играть на максимум, но из описания метода ясно, что можно пробовать воспитывать самые разные программы. Но для этого надо с начала обучения задать цель программе - ЧЕМУ она должна научиться.

Reply


akor168 March 24 2019, 21:44:17 UTC
Идеи которые возможно будут использоваться в новых версиях Лилы.

https://medium.com/@veedrac/leela-chess-test40-test50-and-beyond-c15896becfac

Reply


Leave a comment

Up