Независимые один от другого агенты нейронной сети самостоятельно выработали командную тактику в трехмерном пространстве, даже не зная правил игры и условий для победы, после чего уничтожили команды из людей в режиме Capture the Flag, пишет Science.
«Мы показали, что машина может самостоятельно начать очень хорошо играть в полноценные трехмерные игры, используя для обучения лишь те пиксели, которые выводятся на экран монитора», — уточнил разработчик стартапа DeepMind Дэвид Сильвер.
Кооперативный режим Quake III имеет определенные сложности
для искусственного интеллекта — в нем необходимо командное взаимодействие.
Игроки объединяются в две команды, каждая из которых пытается проникнуть на
базу противника и выкрасть его знамя.
Всего за 45 тысяч матчей AlphaZero достигла уровня игроков-новичков. Через 200 тысяч игр она начала побеждать профессионалов и стала неотличимой в стиле игры и поведении от людей, отмечают создатели.
Проверку AlphaZero прошла в рамках небольшого чемпионата по Quake III. Ученые искусственно замедлили скорость реакции AlphaZero и уменьшили точность прицеливания, однако живые игроки не смогли победить машину.