Между прочим, "народная" Альфа-Зеро, называемая ЛилаЧесс, доросла до уровня топ-движков, и уже играет с ними на равных и выигрывает (а до этого заняла второе место в чемпионате мира среди движков после СтокФиша
( Read more... )
Лила до сих пор маты зевает, играя в остальном на равных со стокфишем. По одной из ссылок в таге Leela в последнем блоге приводится конкретный пример.
Французскую защиту, кстати ни Лила, ни Альфа самостоятельно(то есть когда дебюты не форсируют, а в 1000 игр Альфа-Стокфиш там были тематические блоки, а в чемпионате среди машин они также играют часть пар игр на конкретный дебют по книге) не играет, и возможно поэтому промежуточные версии недостаточно хорошо ее понимают. Но на е4 Лила в свободной игре уже всегда отвечает е5. У Альфа были те же повадки, то есть это не случайность - нейронки остальные варианты считают худшими (и скорее всего так оно и есть).
Я с темой не знаком. Подскажите6 я эти шахматно-сетевые ИИ могут играть в долю силы, как это делается в программах для новичков - ну там вчетверть силы, вполовину и пр.? Чтобы новичку было интересно. Если могут - как это достигается, там же вроде самообучение на полную и нет никакого регулирвоания? Если не могут, это занятно.
Это интересный вопрос. Теоретически, это может быть максимально настраиваемо. Но проблема в том, что это надо либо закладывать изначально в процесс обучения, и если этого не сделано, то ее придется учить заново, иначе заложить например чтобы она училась не только выигрывать оптимально сильным ходами, но и поддаваться(если попросят), или делать объективно не лучший ход, но наиболее выигрышный именно против этого соперника(например, жертва некорректна, но слабый игрок не найдет опровержение) . Говоря откровенно одна из моих идей, что таким образом можно даже попробовать натренировать программу, которая одновременно учиться тому как учить людей своему стилю игры(например генерируя признаки позиции которые людям не знают
( ... )
С другой ЦЕЛЕВОЙ функцией. То есть мы учим не просто выигрывать, а например выигрывать максимально издевательски, или максимально зрелищно, или вообще "кандибобриком". Этого еще никто не делал, поскольку пока все хотят просто научить играть на максимум, но из описания метода ясно, что можно пробовать воспитывать самые разные программы. Но для этого надо с начала обучения задать цель программе - ЧЕМУ она должна научиться.
Comments 17
Reply
Там Альфа взял пешку, которую по книге брать нельзя.
Reply
Французскую защиту, кстати ни Лила, ни Альфа самостоятельно(то есть когда дебюты не форсируют, а в 1000 игр Альфа-Стокфиш там были тематические блоки, а в чемпионате среди машин они также играют часть пар игр на конкретный дебют по книге) не играет, и возможно поэтому промежуточные версии недостаточно хорошо ее понимают. Но на е4 Лила в свободной игре уже всегда отвечает е5. У Альфа были те же повадки, то есть это не случайность - нейронки остальные варианты считают худшими (и скорее всего так оно и есть).
Reply
Reply
Reply
Reply
Reply
https://medium.com/@veedrac/leela-chess-test40-test50-and-beyond-c15896becfac
Reply
Leave a comment