Компания DeepMind опубликовала новое исследование, на этот раз - совместно с 14-м чемпионом мира по шахматам Владимиром Крамником. Самообучающаяся шахматная программа AlphaZero использовалась для изучения вариантов шахмат с новыми правилами.
Исследование под названием
Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess (Оценка игрового баланса с помощью AlphaZero: изучение альтернативных правил шахмат) написано представителями Deepmind Ненадом Томашевым, Ульрихом Паке и Демисом Хассабисом в сотрудничестве с Владимиром Крамником. Российский гроссмейстер работал с DeepMind целый год со времени публикации его статьи о шахматах без рокировки.
В новой работе (
см. в PDF) шахматы без рокировки рассматриваются наряду с восемью другими вариантами шахмат. AlphaZero помогла всего за несколько часов накопить опыт, равнозначный десятилетиям игры людей, и позволила представить, каковы были бы партии сильных шахматистов-людей, специализирующихся на этих вариантах.
Создание новых игр - в целом, сложный процесс. Придумать новый играбельный вариант шахмат тоже трудно. Исследователи пишут: "Создание увлекательных и сбалансированных правил игры - нетривиальная задача в связи со сложностью оценки воздействия отдельных изменений на динамику и привлекательность игры".
Генеральный директор Chess.com по шахматам, ММ Дэнни Ренш детально изучил работу благодаря доступу к ней и партиям, полученным задолго до публикации, и подготовил краткий обзор (планируются и другие видео!) узловых моментов исследования, а также собственный рейтинг "10 вариантов шахмат", изучавшихся с помощью AlphaZero:
Используя систему обучения с подкреплением AlphaZero, ученые хотели показать потенциал AlphaZero в качестве "инструмента творческого поиска и разработки новых вариантов шахмат".
Источник