Удивительно, что некоторые из самых передовых ИИ на планете внедряются в качестве еще одного способа побудить вас использовать Google+. Теперь вы можете искать немаркированные фотографии, на которых есть определенные объекты, например автомобиль. В этом вам поможет глубокое обучение.
Если вы прошли курс Джеффри Хинтона по нейронным сетям в прошлом году, то вы помните пример, использованный для введения сверточных нейронных сетей для распознавания объектов. Конкурс ImageNet Large Scale Visual Recognition Challenge 2012 предоставил возможность использовать различные методы искусственного интеллекта для распознавания объектов в большой библиотеке фотографий. Все, что нужно было сделать программе, — это правильно классифицировать фотографию в одну из 1000 категорий и поставить ограничительную рамку вокруг объекта, названного в категории. Большим сюрпризом в то время было то, что наиболее эффективной техникой оказалась большая глубокая нейронная сеть под названием SuperVision, построенная Алексом Крижевским, Ильей Суцкевер и Джеффри Хинтоном на основе сверточной сети, впервые разработанной Янном ЛеКуном.
Сверточная сеть — это одна и та же сеть, применяемая в разных местах изображения.
Сверточная сеть похожа на любую нейронную сеть, но она разработана с учетом того факта, что объект может быть на фотографии в любом месте или ориентации. Это работает так, что эта сеть реплицируется в каждой точке изображения, так что у нее есть возможность одинаково реагировать на объект независимо от того, где он находится на фотографии. SuperVision описывается его создателями как:
Наша модель представляет собой большую глубокую сверточную нейронную сеть, обученную на необработанных значениях пикселей RGB. Нейронная сеть, которая имеет 60 миллионов параметров и 650 000 нейронов, состоит из пяти сверточных слоев, некоторые из которых сопровождаются слоями максимального объединения, а три глобально связанные слои с финальным софтмаксом на 1000 направлений. Он был обучен на двух графических процессорах NVIDIA около недели. Чтобы ускорить обучение, мы использовали ненасыщающие нейроны и очень эффективную реализацию сверточных сетей на графическом процессоре.
Интересно то, что даже когда сеть ошибалась, вы могли видеть, почему она ошибалась, и ее вторые предположения также в целом были разумными.
Впечатляет, но это всего лишь еще один эксперимент с искусственным интеллектом, работающий в направлении чего-то практического, возможно, через годы.
Однако, если вы сегодня перейдете к своим фотографиям в Google+ и попробуете выполнить поиск по запросу «машина», «цветы», «море» или «пляж», вы можете быть удивлены, получив приемлемый набор результатов, несмотря на то, что не отметили ни одного из своих фотографии таким образом, чтобы облегчить поиск. Более того, даже в неудачах есть разум, который может даже вызвать улыбку на вашем лице.
Может ли это быть глубокая сверточная сеть? Мы сообщили еще в марте, что Хинтон, Крижевский и Суцкевер были наняты Google — поэтому я был бы очень удивлен, если бы это не было. Но все, о чем Google хочет говорить, это то, что вам нужно быть пользователем Google+, чтобы опробовать эту футуристическую технологию.
В блоге поиска Google говорится следующее:
С сегодняшнего дня вы сможете легче находить свои фотографии и связываться с друзьями, местами и событиями на своих фотографиях в Google+. Например, теперь вы можете искать свадебные фотографии своего друга или фотографии с концерта, который вы недавно посетили. Чтобы компьютеры выполняли тяжелую работу за вас, мы также начали использовать компьютерное зрение и машинное обучение, чтобы помочь распознавать более общие концепции на ваших фотографиях, такие как закаты, еда и цветы.
Работает неплохо! А в случае неудачи вы можете простить это, потому что видите, что то, что он предлагает, можно спутать с тем, что вы искали — ищите реку, и вам могут предложить озеро или высохшее русло реки, и оба варианта кажутся разумными.
Это первый раз, когда нейронная сеть была использована в приложении для массового рынка, и для ИИ, чтобы распознавать объекты на фотографиях полезным способом, является большим прорывом — конечно, Google мог бы сделать немного больше шума из-за технологии, чем она делает на данный момент!