ИИ DeepMind победила экспертов в настольной игре Stratego, которая сложнее го

Еще одна игра, считавшаяся слишком сложной для машин, пала под их натиском. Искусственный интеллект DeepNash, созданный специалистами из DeepMind, прославившимися своими победами над чемпионами го и Starcraft, не уступил лучшим игрокам в «Стратего», сложную стратегическую настольную игру с неполной информацией.

По определенным параметрам «Стратего» игра более сложная для освоения искусственным интеллектом, чем го или покер. Два игрока размещают на поле по 40 фишек, имеющих разный ранг и свойства, при этом противник может догадаться о том, какая именно фишка ему противостоит, только по косвенным признакам. Задача — захват вражеского флага.

Дерево игры «Стратего» — граф всех возможных путей развития — равен 10 состояниям в 535 степени. У го, например, 10 в 360 степени. Что касается неполноты информации, то и тут «Стратего» сложнее: у игры 10 в 66 степени возможных положений фишек, тогда как в техасском холдеме для двух человек — только 10 в шестой.

DeepNash, названный в честь математика Джона Нэша, автора «равновесия Нэша» из теории игр, объединил алгоритм обучения с подкреплением с глубокой нейросетью, пишет Nature. Первый компонент ищет наилучшую стратегию для каждого состояния игры. Чтобы научиться этому, алгоритм сыграл 5,5 млрд партий. Результаты партий приводили к корректировкам внутри нейросети. Авторы подчеркивают, что в отличие от AlphaGo и прочих, более ранних систем, созданных DeepMind для игр, DeepNash не осуществляет поиск через дерево игры, чтобы оптимизировать себя.

В апреле в течение двух недель DeepNash провел серию матчей против людей на онлайн-платформе Gravon. После 50 партий ИИ поднялся на третье место среди всех игроков с 2002 года.

«Наша работа показывает, что такие сложные игры, как „Стратего“, включающие неполную информацию, не требуют для решения методов поиска, — сказал Карл Тьюилс, один из специалистов DeepMind. — Это действительно большой шаг вперед в ИИ».

В начале осени команда DeepMind научила виртуальных гуманоидов работать сообща, играя в футбол. При этом правил игры машине никто не объяснял, она до всего доходила сама, через наблюдение и повторение. Постепенно под руководством алгоритмов неуклюжие человечки с реалистичными пропорциями и массой превратились в профессионалов своего дела. На то, чтобы приобрести базовые навыки игры в футбол у ИИ ушло 24 часа реального времени.

Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

ХайТек+