Выпущены API-интерфейсы Microsoft Cognitive Services


Microsoft объявила об общедоступности в Azure своих Face API и Computer Vision API, чтобы предоставить разработчикам простые инструменты для обработки и интерпретации изображений. Content Moderator — третий из недавно выпущенных API.

Face API был одним из первых API-интерфейсов искусственного интеллекта Project Oxford, первоначально анонсированных в апреле 2015 года на конференции Build. В то время он предлагал четыре API на основе REST, другие из которых были Speech, Vision и Language, которые были доступны разработчикам для включения искусственного интеллекта из машинного обучения в свои собственные приложения без необходимости тратить время на обучение.

Мы уже получили массу удовольствия от возможностей Face API оценивать возраст, идентифицировать близнецов, обнаруживать эмоции и способности Vision API распознавать собак и их породу благодаря демонстрационным приложениям, созданным для демонстрации возможностей Project Oxford API. И поскольку API-интерфейсы были с открытым исходным кодом, у них есть много других людей.
На прошлогодней выставке Build Project Oxford Microsoft Cognitive Services, к тому времени на различных этапах предварительной версии была доступна коллекция из 21 API.
Количество API под зонтиком Cognitive Services теперь выросло до 25 в пяти категориях:

Объявление об общедоступности Face API, Computer Vision API и Content Moderator API было сделано на онлайн-мероприятии Microsoft Data Amp. Его предоставила Ана Рот, руководитель программы в группе Microsoft Cognitive Services, и вы можете увидеть ее 8-минутный вклад в этом видео:

Она указывает на три преимущества использования Microsoft Cognitive Services для добавления возможностей искусственного интеллекта в приложение:

Легко — это REST API, поэтому для их добавления требуется всего лишь несколько строк кода.
Гибкость — может быть интегрирована в различные языки и платформы, имеется широкий спектр API.
Протестировано — создано экспертами в своей области из Microsoft Research, Bing и машинного обучения Azure для поддержки собственных приложений, включая Cortana, и теперь доступно всем, в комплекте с документацией и образцом кода.

Затем идет новость о том, что три API только что достигли статуса GA. Первым будет рассмотрен Face API, который обнаруживает человеческие лица и сравнивает похожие, объединяет людей в группы в соответствии с визуальным сходством и идентифицирует людей, ранее отмеченных тегами. Новая функция, по словам Анны, — это способность определять эмоции людей на изображениях, а также их возраст и пол.

В API компьютерного зрения также есть новые функции, которые предоставляют инструменты для понимания содержимого любого изображения. Помимо создания тегов, которые идентифицируют объекты, знаменитостей или действия на изображении, и создания связных предложений для их описания, которые мы уже видели в действии (см. Наше введение в его возможности создания субтитров), теперь вы можете обнаруживать ориентиры на изображениях. Обнаружение рукописного ввода также было добавлено, но эта функция все еще находится в стадии предварительного просмотра. Примеры того, как использовать обнаружение ориентиров и распознавание рукописного ввода, включены в сообщение блога Microsoft Cognitive Services.
Content Moderator — третий из трио. Он обеспечивает машинную модерацию текста и изображений, дополненную инструментами проверки, выполненными человеком. Модерация видео доступна в предварительной версии как часть служб мультимедиа Azure. Как и другие API-интерфейсы, его можно попробовать бесплатно, и у него есть бесплатный уровень, в этом случае 1 вызов в секунду до 5000 вызовов в месяц.


Добавить комментарий