Гигантский Толчок Amazon В Машинное Обучение


Amazon SageMaker, полностью управляемый сервис для процесса машинного обучения; AWS DeepLens, беспроводная видеокамера с поддержкой глубокого обучения и четыре новых сервиса приложений для машинного обучения были анонсированы в третий день AWS re:Invent в этом году и являются прямым вызовом Google и Microsoft.

До сих пор, когда мы объединили Amazon и машинное обучение в одном предложении, это обычно происходило в контексте систем рекомендаций. Действительно, когда Amazon Machine Learning был представлен в 2015 году на AWS re:Invent, рекомендации, основанные на покупках, использовались в качестве основной иллюстрации. Это изменилось в одночасье с появлением ряда новых продуктов и услуг, анонсированных генеральным директором AWS Энди Ясси. Теперь Amazon готова воспользоваться своим положением ведущего облачного провайдера, чтобы проникнуть в области машинного обучения и искусственного интеллекта, в которых в настоящее время доминируют Microsoft и Google.

Представляя SageMaker, Amazon использует уже знакомый рефрен:

Сегодня внедрение машинного обучения является сложным, требует большого количества проб и ошибок и требует специальных навыков. Разработчики и специалисты по обработке данных должны сначала визуализировать, преобразовывать и предварительно обрабатывать данные, чтобы привести их в формат, который алгоритм может использовать для обучения модели. 

Мы знаем, как это происходит — обучение моделей требует огромного количества вычислительной мощности и огромных затрат времени, на каждый этап уходит много усилий и догадок. Тогда для развертывания требуется другой набор специализированных навыков.

Полностью управляемый сервис, SageMaker-это решение Amazon для устранения:

«тяжелая работа и догадки на каждом этапе процесса машинного обучения»

Он состоит из трех основных компонентов, которые могут использоваться изолированно или в качестве сквозного процесса:

Создание: Нулевая настройка размещенных IDE ноутбуков Jupyter для исследования, очистки и предварительной обработки данных. Вы можете запускать их на экземплярах общих типов или на экземплярах с питанием от графического процессора.

Обучение модели: Распределенная служба построения, обучения и проверки моделей. Вы можете использовать встроенные общие контролируемые и неконтролируемые алгоритмы и фреймворки обучения или создать собственное обучение с помощью контейнеров Docker. Обучение может масштабироваться до десятков экземпляров, чтобы обеспечить более быстрое построение модели. Обучающие данные считываются из S3, а артефакты модели помещаются в S3. Артефакты модели-это параметры модели, зависящие от данных, а не код, который позволяет делать выводы из модели.

Хостинг моделей: служба хостинга моделей с конечными точками HTTPs для вызова ваших моделей для получения выводов в реальном времени. Эти конечные точки могут масштабироваться для поддержки трафика и позволяют тестировать несколько моделей одновременно. Опять же, вы можете создать эти конечные точки с помощью встроенного SDK или предоставить свои собственные конфигурации с образами Docker.

Комментируя SageMaker, Свами Сивасубраманян, вице-президент по машинному обучению AWS, сказал::

«Наше первоначальное видение AWS состояло в том, чтобы позволить любому человеку в его комнате в общежитии или гараже иметь доступ к тем же технологиям, инструментам, масштабам и структуре затрат, что и крупнейшие компании в мире. Наше видение машинного обучения ничем не отличается, мы хотим, чтобы все разработчики могли использовать машинное обучение гораздо более широко и успешно, независимо от уровня их навыков машинного обучения. Amazon SageMaker устраняет большую часть грязи и сложности, связанных с машинным обучением, чтобы разработчики могли легко начать работу и стать компетентными в создании, обучении и развертывании моделей.» 

Введение Энди Джасси в SageMaker содержит более подробную информацию:

Сивасубраманян также объяснил, как четыре новых приложения машинного обучения являются естественным продолжением AWS:

«Сегодня клиенты хранят больше данных, чем когда-либо прежде, используя Amazon Simple Storage Service (Amazon S3) — масштабируемое, надежное и безопасное озеро данных. Эти клиенты хотят использовать эти данные для своей организации и клиентов, и для этого им нужны простые в использовании инструменты и технологии, чтобы разблокировать интеллект, содержащийся в этих данных. Мы рады представить четыре новых приложения для машинного обучения, которые помогут разработчикам немедленно приступить к созданию нового поколения интеллектуальных приложений, которые могут видеть, слышать, говорить и взаимодействовать с окружающим миром.»

Amazon Transcribe (доступен в предварительном просмотре) преобразует речь в текст, позволяя разработчикам превращать аудиофайлы, хранящиеся в Amazon S3, в точный, полностью пунктуированный текст. Обученный обрабатывать даже звук с низкой точностью, например записи контакт-центра, с высокой степенью точности он может генерировать отметку времени для каждого слова, чтобы разработчики могли точно выровнять текст с исходным файлом. Первоначально он поддерживает английский и испанский языки с большим количеством языков, чтобы следовать. В ближайшие месяцы будет добавлена возможность распознавания нескольких динамиков в аудиофайле вместе с возможностью загрузки пользовательского словаря для более точной транскрипции.

Amazon Translate (доступен в предварительном просмотре) использует методы нейронного машинного перевода для обеспечения высокоточного перевода текста (как в короткой, так и в длинной форме) с одного языка на другой. В настоящее время он поддерживает перевод между английским и шестью другими языками (арабским, французским, немецким, португальским, упрощенным китайским и испанским), а в 2018 году их будет еще много.

Amazon Comprehend (доступен сегодня) может понимать текст на естественном языке из документов, сообщений в социальных сетях, статей или любых других текстовых данных, хранящихся в AWS. Он использует методы глубокого обучения для идентификации текстовых объектов (например, людей, мест, дат, организаций), языка, на котором написан текст, настроения, выраженного в тексте, и ключевых фраз с понятиями и прилагательными, такими как «красивый», «теплый» или «солнечный». Amazon Comprehend интегрируется с AWS Glue, чтобы обеспечить сквозную аналитику текстовых данных, хранящихся в источниках данных Amazon, включая S3, Redshift, RDS и DynamoDB.

Amazon Rekognition Video (доступно сегодня) может отслеживать людей, обнаруживать действия и распознавать объекты, лица, знаменитостей и неподходящий контент в миллионах видео, хранящихся в Amazon S3. Он также обеспечивает распознавание лиц в режиме реального времени на миллионах лиц для видео в прямом эфире и может автоматически помечать определенные разделы видео метками и местоположениями (например, пляж, солнце, ребенок), обнаруживать действия (например, бег, прыжки, плавание), обнаруживать, распознавать и анализировать лица, а также отслеживать нескольких людей, даже если они частично скрыты от просмотра в видео.

Этот последний сервис основан на Amazon Rekognition для неподвижных изображений, который был запущен в прошлом году на AWS re:Invent. В то же время были представлены Amazon Polly, сервис преобразования текста в речь и Amazon Lex, который сочетает в себе распознавание речи и понимание естественного языка и поддерживает Amazon Alexa. Тогда я отметил, что эти услуги казались догоняющими те, которые предоставляла Microsoft. Однако, поскольку AWS имеет более развитую облачную экосистему, Amazon, похоже, сейчас делает шаг вперед по сравнению с Microsoft Cognitive Services.

AWS DeepLens утверждает, что является первым в своем роде:

 полностью программируемая видеокамера с поддержкой глубокого обучения, предназначенная для того, чтобы в буквальном смысле передать глубокое обучение в руки любого разработчика.

AWS DeepLens, которая доступна для предварительного заказа и будет отправлена в США в апреле 2018 года, стоит 249 долларов, как и носимая камера Google под названием Clips, которая дебютировала в прошлом месяце и использует машинное обучение для идентификации людей и домашних животных по вашему выбору и только для их захвата. Цена — единственная общая черта. AWS DeepLens-это HD-видеокамера с бортовыми вычислениями, способная выполнять более 100 миллиардов операций глубокого обучения в секунду. Он поставляется с образцами проектов, примерами кода и предварительно подготовленными моделями, чтобы разработчики, не имеющие опыта машинного обучения, могли запустить свою первую модель глубокого обучения менее чем за десять минут. Например, AWS DeepLens может быть запрограммирован на распознавание номеров на номерном знаке и запуск системы домашней автоматизации для открытия гаражной двери, или AWS DeepLens может распознавать, когда собака находится на диване, и отправлять текст своему владельцу.

AWS DeepLens интегрируется с Amazon SageMaker, чтобы разработчики могли обучать свои модели в облаке с помощью Amazon SageMaker, а затем развертывать их в AWS DeepLens всего несколькими щелчками мыши в консоли управления AWS. 

Опять же, именно эта облачная интеграция может дать Amazon преимущество над своими конкурентами и сделать ее главным игроком в области искусственного интеллекта.


Добавить комментарий