Агентство кибербезопасности

Нейросеть Google научилась играть с собой в прятки

Опубликовано at 17:04
411 0

Некоммерческая исследовательская компания OpenAI, основанная Илоном Маском, уже неоднократно представляла общественности свои наработки в области ИИ. В новом эксперименте специалист научили нейросеть играть в прятки, познавая правила игры в процессе.

В самом начале на небольшой виртуальной площадке разместили синих (прячутся) и красных (ищут) агентов. Сообщается, что сначала компьютерные игроки беспорядочно бегали по карте и красные без проблем находили синих. Но со временем, когда ИИ понял суть игры, красным становилось все сложнее.

Сначала у синих появилось время на подготовку — тогда они поняли, что могут закрываться от противников ящиками. Прошло много раундов, прежде чем красные поняли, что могут преодолевать преграды при помощи трамплинов.

Так проходило обучение — агентов помещали во все новые и новые условия, в которых синие постоянно находили способ, как спрятаться, после чего красные обязательно находили лазейку, как обойти препятствия.

Этот любопытный эксперимент запечатлен ниже на видео в хорошей графической визуализации:

В июне эксперты АКБ рассказывали про очередные успехи проекта Google DeepMind. Разработанный в его рамках ИИ «AlphaGo» впервые познакомился с командным шутером Quake III (ему не объяснили вообще ничего) и после череды тренировок сумел последовательно победить всех соперников-людей, от рядовых до профи. Поразительней всего, что ИИ сам досконально освоил правила через наблюдение и пробы и даже освоил кооперативный стиль «робот-человек» на уровне, превосходящем «человек-человек».

Испытания проходили в режиме игры «Захват флага» – это достаточно простой (для людей и пре-программированных ботов) соревновательный режим: у каждой команды есть некий маркер, расположенный на её базе, и цель состоит в том, чтобы захватить маркер соперников и успешно доставить его к себе.

Чтобы проверить способность к полевому обучению, ИИ с ходу поставили в самое невыгодное положение, подключив к игровому интерфейсу без интерпретации данных. То есть, ИИ видел движущиеся на экране пиксели и знал всего один критерий успеха – помещение флага в определенную точку пространства. Понятия «друг», «враг», «база», «оборона», «контратака», наличие в игре оружия и способы его использования – все это AlphaGo логически вывел, наблюдая за процессом.

Читайте подробнее в этой статье .

Related Post