Технология распознавания изображений, разработанная Microsoft Research, была использована для решения проблемы идентификации цветов и утверждает, что ее успешность составляет 90%, что почти наравне с экспертами-ботаниками.
За последние пару лет мы развлекались с приложениями для распознавания лиц, разработанными Microsoft Research для оценки возраста, идентификации близнецов и обнаружения эмоций. Microsoft Research UK также применила методы искусственного интеллекта машинного обучения и компьютерного зрения в области собак, выпустив смартфон и приложение на основе браузера для определения пород, см. Что это за собака.
Учитывая, что существует не менее 250 000 видов цветов и что даже опытные ботаники не могут идентифицировать их все, это область, которая кажется идеальным кандидатом для проверки пределов технологии распознавания изображений.
Согласно блогу Microsoft Reserch, это была «случайная встреча» между Йонг Руи, помощником управляющего директора Microsoft Research Asia (MSRA), и ботаниками из Института ботаники Китайской академии наук (IBCAS), которая привела к этой последней инициативе по создать инструмент, способный различать крошечные различия между многими видами цветов.
Ботаники накопили в общедоступном хранилище 2,6 миллиона изображений, в которые может внести свой вклад любой человек в мире. Первой задачей, стоявшей перед командой MSRA, было создание алгоритмов для фильтрации «плохих» изображений. Для этого они обучили глубокую нейронную сеть распознавать изображения с помощью набора обучаемых фильтров, который работает следующим образом:
Во время прямого прохода каждый фильтр сворачивается по ширине и высоте входного объема, вычисляя скалярное произведение между элементами фильтра и входом. Это создает двухмерную карту активации этого фильтра. В результате сеть изучает фильтры, которые активируются для определенных типов функций в заданном пространственном положении во входных данных.
Вводя миллионы изображений в структуру глубокого обучения, исследователи MSRA позволили движку точно идентифицировать изображения более чем в 90% случаев.
Если Microsoft Research продолжит создавать приложение для автоматического распознавания цветов, оно не будет первым в своем роде. Команда Flower Checker, о приложении которой мы впервые сообщили в прошлом году, недавно выпустила бота для идентификации растений, который интегрирован с Facebook и имеет точность 60% благодаря использованию Google Tensorflow. Бот знает о 1024 наиболее часто идентифицируемых таксонах из базы данных 150 000 фотографий растений, собранных приложением Flower Checker для iPhone / Android, которое позволяет пользователям загружать фотографии, которые затем идентифицируются ботаниками-людьми, услуга, которую он до сих пор предоставляет.
Оглядываясь назад, можно сказать, что исследователи из Колумбийского университета, Университета Мэриленда и Смитсоновского института первыми создали приложение, которое применило методы, разработанные для распознавания лиц, в ботанике, но выбрали более ограниченную область древесных пород для приложения Leafsnap. Первоначально ограниченный деревьями в северо-восточных Соединенных Штатах и Канаде, теперь есть также версия для Великобритании, но она по-прежнему доступна только для устройств iOS.