Обновления программного обеспечения Amazon для обнаружения лиц привели к значительному увеличению его производительности при обнаружении лиц на изображениях, предотвращении ложных срабатываний и сопоставлении.
Когда мы объединяем Amazon и искусственный интеллект в одном предложении, мы обычно имеем в виду распознавание речи и, в частности, Alexa. Однако службы искусственного интеллекта Amazon также включают Amazon Rekognition, которая распознает объекты на фотографиях.
Этот полностью управляемый сервис для обнаружения и распознавания изображений, предназначенный для облегчения разработчикам добавления анализа изображений в приложения, использует модели глубоких нейронных сетей, обученные Amazon. Являясь частью Amazon Web Services (AWS), Rekognition напрямую интегрируется с Amazon S3 и AWS Lambda для создания масштабируемых, доступных и надежных приложений для анализа изображений.
В прошлый раз, когда мы смотрели на Rekognition, он добавил оценку возраста к своим способностям распознавания лиц. В последнем обновлении улучшена способность обнаруживать лица на изображениях, а также возможность более точного сопоставления лиц и получения улучшенных атрибутов возраста, пола и эмоций для лиц.
Как объясняют Ранджу Дас и Венкатеш Багария в блоге AWS Machine Learning Blog:
В реальных изображениях различные аспекты могут влиять на способность системы обнаруживать лица с высокой точностью. Эти аспекты могут включать вариации позы, вызванные движением головы и / или движением камеры, окклюзию из-за объектов переднего или заднего плана (например, лица, покрытые шляпами, волосами или руками другого человека на переднем плане), вариации освещения (например, низкий контраст и тени), яркое освещение, которое приводит к размытым лицам, низкому качеству и разрешению, что приводит к шумным и размытым лицам, а также искажениям от самих камер и объективов. Эти проблемы проявляются в виде пропущенных обнаружений (лицо не обнаружено) или ложных обнаружений (область изображения определяется как лицо, даже если лица нет).
Они также предоставляют примеры этих сложных ситуаций, демонстрирующие, как обновленный сервис успешно обнаруживает лица, которые ранее были упущены. На изображениях справа есть ограничивающие рамки, а на фотографиях слева — нет.
Варианты позы:
Сложное освещение:
Размытие и окклюзия:
Суть в том, что Amazon Rekognition теперь может обнаруживать на 40 процентов больше лиц, а количество ложных срабатываний снижается на 50 процентов. Кроме того, теперь распознавание лиц возвращает на 30 процентов больше правильных «наилучших» совпадений (наиболее похожих лиц) по сравнению с предыдущей моделью при поиске по большой коллекции лиц.