Проект AIX Minecraft делает программное обеспечение для мышления возможным


Исследователи Microsoft решили изменить мир к лучшему, пытаясь заставить персонажа Minecraft взобраться на виртуальный холм. Это может показаться не таким уж большим делом, но это так. Разница возникает из-за попытки запрограммировать его для обучения, а не из-за программирования для выполнения определенных задач.

До сих пор нейронная сеть снабжалась миллионами предварительно классифицированных наборов данных, чтобы ее научили делать что-то. Так называемое контролируемое обучение приводило к тому, что сети изучали только то, что мы уже знали, как делать.
Именно в этот момент AlphaGo все изменила.
В то время как DeepBlue от IBM выиграл у Капсарова в игре в шахматы, будучи запрограммированным на игру путем поиска вперед и оценки ходов, Deep Mind AlphaGo от Google играл, комбинируя несколько уровней нейронных сетей и усиленное обучение для достижения экстраординарного.
Как объяснил Майк Джеймс:
«AlphaGo научилась играть в Го от новичка до высшего уровня всего за несколько месяцев — в основном, играя сама. Ни один программист не научил AlphaGo играть в смысле написания четких правил игры».
Аналогичные принципы применимы к проекту AIX, вдохновленному Microsoft Minecraft.
Точно так же, как игроки-люди могут свободно исследовать открытый мир Minecraft, открывая, строя и сотрудничая в пути, то же самое делается и для агентов ИИ; думать и действовать как люди, которые полагаются на прошлый опыт и интеллект, не имея предварительных знаний об их окружении или каких-либо других данных, передаваемых им. Используя только пиксельные данные из игрового обучения с подкреплением, Q-обучение, если быть точным, используется для определения того, какое поведение лучше всего подходит для выполнения задачи. Никаких внешних указаний не предусмотрено. Это очень похоже на более ранние попытки DeepMind научиться играть в аркадные игры с использованием обучения с подкреплением, которые были очень успешными. Большая разница в том, что Minecraft представляет собой гораздо более сложный виртуальный мир.

Это то же самое, что бросить Беар Гриллса из Discovery Channel на отдаленный и изолированный остров, которому нужно выжить только с компасом и веревкой, а также необходимо взаимодействовать с окружающей средой и придумывать выход, просто полагаясь на его опыт и интуицию. Если программа может делать что-то подобное, я не уверен, следует ли ее по-прежнему называть программой.
Итак, за простой для нас, людей, задачей подняться на холм, многое делается для того, чтобы ИИ выполнял то же самое.
Эти программные агенты, в которых программное обеспечение наряжается в роботов, имеют дополнительное преимущество перед своими аппаратными аналогами. Создавать программное обеспечение легко, дешево, одноразово и физически не ломается, поэтому они идеально подходят для имитации навигации ИИ в неизвестной среде.
В этом назначение таких инструментов, как Gazebo; создавать дешевых одноразовых роботов, в отличие от затрат на создание реального робота из Атласа, который демонстрирует такой же интеллект в изучении, обнаружении и перемещении по своему окружению, как и агенты платформы AIX, только для того, чтобы упасть и сломаться. Программное обеспечение не подвержено таким проблемам
Конечно, этот вид продвинутого интеллекта открывает двери новому мировому порядку, мировому порядку мыслящих машин, и скоро они появятся, когда Microsoft откроет исходные коды платформы для максимального мозгового штурма и сотрудничества. Как объясняет Эвелин Виегас, директор по работе с искусственным интеллектом в Microsoft Research:
«Мы ищем возможности, в которых мы действительно можем помочь ускорить темпы инноваций в области искусственного интеллекта так, чтобы они были очень близки к реальному миру, с реальным опытом и реальными данными»,
Microsoft Research также планирует предоставить SDK и API, чтобы механизм можно было импортировать и использовать в программах.

Очень интересная деталь заключается в том, что платформа сможет работать на одинарных ноутбуках с умеренной мощностью, не требуя компьютеров с поддержкой нескольких GPU, поэтому ее повсеместное распространение кажется гарантированным.
Еще одно большое достижение ИИ?
Готов ли мир к тому, что будет дальше?


Добавить комментарий