Институт Аллена спрашивает: «Сможете ли вы сделать ИИ умнее восьмиклассника?»


Конечно, нет, пока нет. Однако сложность задания немного снижается из-за ограничения на вопросы с несколькими вариантами ответов на стандартном экзамене по естественным наукам в 8-м классе.

Если вы его пропустили, Институт искусственного интеллекта Аллена (AI2) создан Полом Алленом, известным соучредителем Microsoft. В то время как Билл Гейтс раздает деньги, чтобы вылечить мир от болезней и бедности, Пол Аллен посвятил часть своих денег «ИИ для общего блага».
Институт работает над рядом проектов, и Project Aristo — один из них. Это символический информационный процессор «старой школы», который собирает информацию и пытается ответить на вопросы науки с множественным выбором. Под «старой школой» я подразумеваю то, что нейронные сети не пострадали во время построения системы. Вместо этого используется подход обработки знаний:

Разбор естественного языка и обработка различных источников знаний в структурированную вычислимую базу знаний
Понимание вопроса; преобразование вопросов, диаграмм и вариантов ответов из экзаменов в вычислимые входные данные
Интеграция с системами обработки диаграмм для выхода за рамки текста и успешного понимания экзаменационных вопросов
Массив решателей, использующих различные статистические методы и методы вывода, чтобы выбрать или сгенерировать правильный ответ

Типичный сеанс с Аристо выглядит примерно так:
Отращивание густого меха зимой помогает некоторым животным
А) Спрятаться от опасности
Б) Привлечь помощника
C) Найдите еду
D) Согреться
на что Аристо отвечает:
Г) Согреться.

Artiso работает достаточно хорошо, но AI2 хочет, чтобы она была лучше, поэтому он объявил конкурс Kaggle с 50 000 долларов в качестве первого приза для системы, которая отвечает на большинство вопросов — плюс 20 000 долларов за второе место и 10 000 долларов за третье.
Конкурс — Allen AI Science Challenge — предоставляет некоторые обучающие данные, набор данных для проверки и образец представления. В обучающей выборке 2 500 вопросов, а в проверочной — 8 132 вопроса. В финальном тесте будет использоваться набор данных из 21 298 вопросов.
Действительно тяжелое состояние:
«Чтобы иметь право на получение призов, представленные модели должны работать автономно, без необходимости подключения к Интернету (например, без использования веб-поиска во время выполнения или веб-API)».
Даже IBM Watson, самая успешная система ответов на вопросы старой школы, не могла обойтись без случайного просмотра Википедии.
Обратите внимание, что конкурс не подразумевает, что вы должны использовать что-то похожее на обработку знаний Аристо. Некоторые конкуренты явно задумываются об использовании нейронных сетей, хотя в этом случае небольшой размер обучающей выборки затруднит поиск достаточных закономерностей, чтобы она работала.
Будет интересно посмотреть, чем все это закончится.
Конкурс открыт и завершится 13 февраля 2016 года. В настоящее время над проблемой работают 106 команд.


Добавить комментарий