Новости с re: Invent, ежегодной конференции разработчиков AWS, на которой представлены три новых сервиса искусственного интеллекта, которые можно использовать в приложениях. Для всех трех доступен уровень бесплатного пользования, что еще больше приближает перспективу применения искусственного интеллекта.
За последние пару месяцев мы неоднократно слышали сообщения Microsoft о демократизации ИИ. Теперь Amazon предоставил три новых SDK, которые позволят всем нам включить глубокое обучение в наши приложения и интерфейсы.
Недавно запущенный портал Amazon AI Services предоставляет доступ к трем новым продуктам и сервису машинного обучения Amazon, о котором мы сообщили в апреле 2015 года, когда было объявлено о нем.
Amazon Rekognition — это полностью управляемый сервис для обнаружения и распознавания изображений, использующий модели глубоких нейронных сетей, призванный упростить разработчикам добавление анализа изображений в приложения. Он напрямую интегрируется с Amazon S3 и AWS Lambda для создания масштабируемых, доступных и надежных приложений для анализа изображений.
Согласно пресс-релизу Amazon:
Amazon Rekognition может находить лица на изображениях и определять атрибуты, например, улыбается ли лицо или открыты глаза. Amazon Rekognition также поддерживает расширенные функции анализа лица, такие как сравнение лиц и поиск по лицам. Используя Rekognition, разработчики могут создать приложение, которое измеряет вероятность того, что лица на двух изображениях принадлежат одному и тому же человеку, тем самым имея возможность проверять пользователя по эталонной фотографии почти в реальном времени. Точно так же разработчики могут создавать коллекции из миллионов лиц (обнаруженных на изображениях) и могут искать лица, похожие на их эталонное изображение в коллекции. Amazon Rekognition устраняет сложность и накладные расходы, необходимые для разработки дорогостоящих конвейеров обработки изображений и управления ими, предоставляя комплексные возможности классификации, обнаружения и управления изображениями в простом, экономичном и надежном сервисе AWS. Amazon Rekognition не требует никаких авансовых платежей, разработчики платят только за анализируемые изображения и хранимые векторы черт лица.
Есть демонстрация для опробования ее, и она выглядит многообещающей — хотя и не очень новой, учитывая, что Microsoft Face API, изначально входившая в Project Oxford, а теперь входящая в его Cognitive Services API, за последние 18 месяцев имела несколько публичных демонстраций.
Это результаты, приведенные для одной из пробных фотографий. Но попробуйте загрузить свои собственные фотографии, и результаты могут быть не такими впечатляющими. На другой фотографии, на этот раз для функции «Обнаружение объектов и сцен», изображена шелковистая златовласая собака, идентифицированная с достоверностью 97,9%, что позволяет предположить, что она может превзойти Microsoft What-Dog.net.
Когда дело касается собак, система могла быть хорошо обучена. У кошек не все так хорошо:
Хорошо, я почти могу понять, почему поза и отсутствие каких-либо объектов для обозначения масштаба могли обмануть приложение, и на другой, очень похожей фотографии результаты были 87,9% для животных и кошек и 79,2% для сиамцев, и Я всегда подозревал, что у моего могги есть сиамские корни.
Но систему легко обмануть. Подпись под моим названием будет дачный сад в снегу с прудом. Да на открытом воздухе / снегу / льду — но где толпа?
В рамках уровня бесплатного пользования AWS вы можете анализировать 5000 изображений в месяц и хранить до 1000 метаданных лиц каждый месяц в течение первых 12 месяцев бесплатно.
Amazon Polly — это служба преобразования текста в речь, и ее уровень бесплатного пользования включает 5 миллионов символов в месяц в течение первых 12 месяцев, начиная с первого запроса на речь.
Согласно Amazon этот новый сервис:
позволяет разработчикам легко добавлять возможности естественной речи к существующим приложениям, таким как программы чтения новостей и платформы электронного обучения, или создавать совершенно новые категории продуктов с поддержкой речи — от мобильных приложений до устройств и устройств. Amazon Polly прост в использовании; разработчики могут отправлять текст в Amazon Polly с помощью SDK или из Консоли управления AWS, и Polly немедленно возвращает аудиопоток, который можно воспроизводить напрямую или сохранять в стандартном формате аудиофайлов. Благодаря 47 реалистичным голосам и поддержке 24 языков разработчики могут выбирать из мужских и женских голосов с различными акцентами для создания приложений для пользователей по всему миру.
В третьем новом сервисе Amazon Lex используется технология, лежащая в основе Amazon Alexa, то есть комбинация автоматического распознавания речи (ASR) и понимания естественного языка (NLU), которая позволяет создавать ботов, которые выполняют такие задачи, как проверка погоды или бронирование рейсов. Опять же, это похоже на то, чтобы догнать Microsoft — вспомните демонстрацию того, как Кортана бронирует номера в отеле через BUILD. Но в этом нет ничего плохого — он предоставляет разработчикам выбор — Azure или AWS. Amazon Lex теперь доступен в виде бесплатной, но ограниченной предварительной версии. Для подачи заявки вам понадобится учетная запись AWS, а также необходимо указать платформы, на которых вы планируете публиковать бота Lex, и сервисы, которые вы планируете интегрировать с ним.