Мы все еще бьем ИИ у Angry Birds


Люди! Будьте спокойны, мы все еще побеждаем злой ИИ в очень важной игре Angry Birds. Недавнее исследование Екатерины Никоновой и Якуба Гемрот из Карлова университета (Чехия) показывает, почему это так.

Angry Bird — забавная и, казалось бы, простая игра, но она сложнее, чем кажется — по крайней мере, для ИИ. Игра, в отличие от многих, в которых искусственный интеллект показал себя лучше всех, включает в себя симуляцию физики, любезно предоставленную Box2D. Вы должны знать игру, но на всякий случай она включает в себя стрельбу по злым птицам из рогатки и попадание в различные сооружения — в основном это весело разрушать вещи. Но почему так сложно для ИИ. Недавнее исследование Екатерины Никоновой и Якуба Гемрота из Карлова университета (Чешская Республика) предполагает следующее:
«Во-первых, эта игра имеет большое количество возможностей действий и почти бесконечное количество возможных уровней, что затрудняет использование простых алгоритмов поиска в пространстве состояний для этой задачи. Во-вторых, игра требует планирования последовательности действий, которые являются связаны друг с другом или найти единственный точный выстрел. Например, неудачно выбранное первое действие может сделать уровень неразрешимым, если заблокировать свинью кучей предметов. Следовательно, для успешного решения задачи игровой агент должен уметь предугадывать или смоделировать результат его собственных действий на несколько шагов вперед ».
С 2012 года было проведено несколько соревнований AIBirds, и на последнем из них была введена сеть обучения Deep-Q, которая используется DeepMind для успешного решения игр Atari. Задача особенно интересна, потому что есть много уровней, и каждый вводит новые функции. На обучающем наборе, состоящем из 21 уровня, сеть смогла решить невидимые уровни, демонстрируя обобщение. Большая проблема обучения заключается в том, что исследователи не имеют доступа к генератору официальных уровней и поэтому не могут проводить обучение на расширенных уровнях.

Так как же он соответствовал людям?
«Одна из целей, которую мы не совсем достигли в этой работе, — превзойти людей в игре Angry Birds. Несмотря на то, что мы приблизились к показателям человеческого уровня на выбранном 21 уровне, мы все равно проиграли 3 из 4 люди в получении максимально возможной общей суммы баллов ».
В целом ИИ налаживается:
«В целом, хотя наш агент превзошел некоторых из предыдущих и нынешних участников конкурса AIBirds и установил новый рекорд для одного из уровней, есть еще много возможностей для улучшений».
Похоже, что основная проблема — не иметь достаточного количества данных для тренировок. Даже в этом случае людям удается взламывать новые невидимые уровни практически без каких-либо данных. Возможно, нам просто нравится бросать вещи и замечать, когда что-то происходит в нашу пользу.


Добавить комментарий