Новый вызов ИИ для совместного ИИ с использованием платформы Microsoft Project Malmo только что начался на Crowd AI, платформе для задач науки об открытых данных, созданной и поддерживаемой в настоящее время Лабораторией цифровой эпидемиологии EPFL в Швейцарии.
Проект Мальмо (основанный на популярной многопользовательской игре Minecraft) — это инструмент исследования искусственного интеллекта для изучения того, как обучать интеллектуальных агентов сотрудничать. Она возникла в 2016 году как открытая платформа для продвижения современных исследований в области искусственного интеллекта, особенно обучения с подкреплением в сложном мире.
Как сообщил Никос Ваггалис в прошлом году, когда был запущен первый совместный вызов ИИ в Мальме.
Все началось с того, что исследователи Microsoft попытались заставить персонажа Minecraft подняться на виртуальный холм. Это может показаться несущественным, но разница заключалась в том, что этот агент ИИ пытался преодолеть свое препятствие путем обучения и взаимодействия со своей средой, а не будучи запрограммированным на это.
В прошлом году инаугурационный вызов, который был разработан, чтобы продвинуть современное состояние совместного ИИ для обучения с подкреплением, попросил команды аспирантов и магистрантов решить игру Minecraft с использованием совместных агентов. Соответствующая игра «Поймай свинью» основана на продолжении охоты на оленя, классическом примере, моделирующем компромиссы между выбором сотрудничества и выходом в одиночку.
В конкурсе приняли участие более 80 команд, в состав которых вошли аспиранты из 26 стран. Победившие записи были обсуждены в блоге Microsoft Reseach, и одна из команд-победителей из Наньянского технологического университета опубликовала статью AAAI о своем подходе, сочетающем обобщенную гипотезу типа агента с новым подходом Q-learning для изучения эффективных политик против каждого типа сотрудничающих агентов.
Теперь Microsoft сотрудничает с Лондонским университетом Королевы Марии и CrowdAI, чтобы совместно провести второй конкурс, MARLO 2018, или дать ему полное название «Обучение игре: Мультиагентное обучение с подкреплением в конкурсе Мальме».
Как и прежде, задачи challenge, начиная от конкурентных сражений за сборку и заканчивая совместными погонями за свиньями, для этого конкурса и примера кода доступны на GitHub. GitHub README.rst объясняет отношения между Марло и Мальме:
Платформа Malmo предоставляет API, который обеспечивает доступ к действиям, наблюдениям (т. Е. местоположению, окружению, видеокадрам, статистике игр) и другим общим данным, которые предоставляет Minecraft. Марло, с другой стороны, является оболочкой для Мальме, которая обеспечивает более высокий уровень API и более стандартизированную RL-дружественную среду для научных исследований.
В нем также говорится, что фреймворк является расширением фреймворка OpenAI Gym, который стал отраслевым стандартом и знакомой платформой с тех пор, как мы впервые столкнулись с ним в 2016 году.
Отборочный раунд для этого конкурса начался 27 июля 2018 года и заканчивается 7 октября 2018 года, и уже более 50 команд зарегистрировались. Чтобы присоединиться к нам, вы должны быть зачислены в аспирантуру и быть старше 18 лет. Сначала нужно зарегистрироваться в CrowdAI, а затем отправиться в репо конкурса на GitHub и раскошелиться на стартовый комплект там. В конце этого раунда будут отобраны 32 команды, которые будут приглашены на финальный турнир для живого соревнования, которое состоится на AIIDE’18, 14-й конференции AAAI по искусственному интеллекту и интерактивным цифровым развлечениям в Университете Альберты в Эдмонтоне, Канада, 14 ноября 2018 года. 32 приглашенные команды будут распределены по восьми группам для определения рейтинга, и лучшие команды в каждом из них пройдут в следующий раунд, четвертьфинал. Процесс повторяется для полуфиналов и гранд-финала.
В конце конкурса семь лучших команд получат грант на поездку с максимальной стоимостью 2500 долларов США для участия в соответствующей научной конференции или семинаре. Кроме того, топ-команда получит второй туристический грант MARLO с максимальной стоимостью 2500 долларов США для участия в Прикладных Днях машинного обучения 2019 года. Три команды-победителя получат спонсорскую поддержку Microsoft Azure с максимальной стоимостью 10 000 долларов США за 1-е место, 5000 долларов США за 2-е место и 3000 долларов США за 3-е место.
Прошлогодний конкурс подтвердил концепцию этого конкурса, и при переезде из Мальме в Марло можно ожидать еще больших успехов в области совместного ИИ. Если вы аспирант и ИИ является вашей областью исследований, это может быть и весело, и полезно.