Microsoft Research присоединилась к золотой лихорадке глубокого обучения и выпустила фото-классификатор на основе нейронных сетей. Утверждается, что Project Adam в пятьдесят раз лучше своих конкурентов, но этого достаточно, чтобы называть прорывом.
Цель проекта Адам:
«создать нейронную сеть в масштабе мозга для работы приложений завтрашнего дня, вдохновленную мозгами сегодняшнего дня»
Как объясняется в промо-видео, глубокое обучение черпает вдохновение в том, как мозг учится обучать программное обеспечение выполнению человеческой деятельности, в частности распознавать речь, интерпретировать и классифицировать изображения и читать документы, о чем, как он утверждает,
Вот некоторые из первых шагов к настоящему искусственному интеллекту:
Как и другие инициативы в области глубокого обучения, исследования Microsoft были сосредоточены на фото классификаторе и привели к созданию классификатора, основанного на асинхронном методе на основе распределенной системы, который работает быстрее, эффективнее и более чем в два раза точнее.
По словам Тришул Чилимби, одного из исследователей Microsoft, возглавлявшего проект Project Adam:
«Мы хотели построить высокоэффективную, хорошо масштабируемую распределенную систему из обычных ПК, которая обладала бы скоростью обучения мирового класса, масштабируемостью и точностью выполнения важной крупномасштабной задачи. «Мы сосредоточились на видении, потому что это была задача, для которой у нас был самый большой общедоступный набор данных … Наша система является универсальной и поддерживает обучение широкому спектру архитектур глубоких нейронных сетей [DNN]. Его также можно использовать для обучения крупномасштабных DNN для таких задач, как распознавание речи и обработка текста ».
Чтобы продемонстрировать свое мастерство, Microsoft Research указывает на тот факт, что он не только может различать типы собак, но и может отличить две породы вельш-корги — пемброк-вельш-корги и кардиган-вельш-корги.
Как и в случае с Deep Neural Net Google, о котором мы узнали в июне 2012 года, ключом к этой способности является использование «сверточных слоев». Чилимби говорит:
«Мы обнаружили, что, добавляя уровни к DNN, вы получаете большую точность до определенного момента. Переход от двух сверточных слоев к трем сверточным слоям и к пяти или шести кажется оптимальным вариантом. И что интересно, люди проводили исследования зрительной коры головного мозга человека и обнаружили, что она состоит примерно из шести слоев в глубину с точки зрения слоев нейронов в головном мозге.
«Причина интереса в том, что каждый уровень этой нейронной сети автоматически изучает высокоуровневую функцию на основе слоя под ним. Слой верхнего уровня изучает концепции высокого уровня, такие как растения, письменный текст или блестящие объекты. Кажется, вы подошли к моменту, когда отдача от погружения на следующий уровень становится все меньше. С биологической точки зрения это тоже кажется правильным.
Объясняя способность Project Adam идентифицировать корги, слои работают следующим образом:
Первый слой изучает контуры фигуры собаки. Следующий слой может изучать текстуры и мех, а третий затем может изучать части тела — форму ушей и глаз. Четвертый уровень будет изучать более сложные части тела, а пятый уровень будет зарезервирован для узнаваемых концепций высокого уровня, таких как морды собак. Информация всплывает вверх, приобретая все более сложное визуальное восприятие на каждом этапе пути.
Проект «Адам» — это не только классификация пород собак. В видео представлены два примера того, что может быть материализовано в результате такого исследования. Во-первых, вы можете сфотографировать свою пищу, чтобы получить мгновенный анализ информации о ее питательной ценности; второй — это фотографирование поражения кожи и отправка его вместе с основными лабораторными результатами для ранней диагностики.
Так это меняет правила игры? Чилимби так считает:
«До сих пор компьютеры были действительно хорошими вычислителями чисел. Теперь мы начинаем учить их распознавать шаблоны. Объединение этих двух вещей вместе откроет новый мир приложений, о котором мы и представить не могли ».