У Amazon есть два новых сервиса с API, готовые к встраиванию в ваши приложения. Transcribe преобразует речь в текст, а Translate переводит текст на другой язык.
Amazon Transcribe — это API преобразования речи в текст, который вы можете легко встроить в свои собственные приложения, и теперь он вышел из пробной стадии и готов к использованию кем угодно. Расшифровывайте утверждения, что они основаны на глубоком обучении, так что, вероятно, где-то там есть нейронная сеть. По сути, все, что вам нужно сделать, это захватить звук и отправить файл, хранящийся на AWS S3, на сервер. Он обрабатывает его и отправляет обратно текст.
Служба способна с высокой точностью и достоверностью обнаруживать в звуке различных динамиков, чтобы создавать внятные транскрипции, чтобы вы могли четко понимать, кто и когда говорил. Вы также можете расширить и настроить словарный запас речевого движка, загрузив специальный словарь, чтобы повысить точность распознавания речи для названий продуктов, предметной терминологии или имен людей.
Он может возвращать транскрипцию с отметкой времени, что делает его полезным для таких вещей, как создание субтитров и каталогизация. Конечно, вам нужно будет попробовать его, чтобы узнать, достаточно ли он подходит для ваших целей, и есть ли уровень бесплатного пользования на 12 месяцев с ограничением 60 минут звука в месяц. После этого это будет 0,0004 доллара за секунду звука, и если это ничего не значит для вас, это эквивалентно примерно 0,72 доллару за 30 минут.
Amazon Translate также основан на глубоком обучении и может работать с шестью языками — испанским, китайским, французским, немецким, арабским и португальским — и в ближайшие месяцы планируется добавить еще шесть — японский, русский, итальянский, традиционный китайский и т. Д. Турецкий и чешский.
Нейронный машинный перевод — это форма автоматизации языкового перевода, которая использует модели глубокого обучения для обеспечения более точного и естественного перевода, чем традиционные статистические алгоритмы перевода и алгоритмы перевода на основе правил. Amazon Translate позволяет локализовать контент, например веб-сайты и приложения, для международных пользователей, а также легко и эффективно переводить большие объемы текста.
Чтобы попробовать это, есть уровень бесплатного пользования на 12 месяцев с ограничением в 2 миллиона символов в месяц. После этого вы платите 15 долларов за миллион символов. Чтобы дать вам некоторое представление о том, сколько это стоит, типичная книга состоит из 300 000 символов, и ее перевод будет стоить около 5 долларов.
Помимо того факта, что сервисы доступны и дополняют предложения Amazon по ИИ, интересно сравнить его подход с Google. Google Translate часто рассматривается как бесплатный сервис, потому что он почти мгновенно доступен конечным пользователям через приложения Chrome или Android. Доступность бесплатного перевода — одно из преимуществ Chrome над Firefox. Если вы, вероятно, получите электронное письмо на иностранном языке, тогда Chrome — это то, что вам нужно. У Amazon теперь есть переводчик, но он предоставляется бесплатно только в течение 12 месяцев. Если цель состоит в том, чтобы нанести ущерб Google, возможно, Amazon следует объединиться с Mozilla, чтобы предоставить конечным пользователям бесплатный перевод. Существующая платная служба перевода Google дороже, чем у Amazon, и составляет 20 долларов за миллион символов.
У Microsoft также есть служба перевода в составе Azure, которая предлагает бесплатную услугу до 2 миллионов символов в месяц, а затем взимает 7,454 доллара США за миллион символов. Доступны различные другие предложения, но в целом Microsoft выглядит как самая дешевая.
Медленно, но верно, похоже, что переводческие и языковые услуги станут тем местом, где ИИ станет мейнстримом. Борьба за ваши доллары искусственного интеллекта не совсем похожа на битву за офисные пакеты прошлого, но Microsoft, Google и Amazon выпускают продукты, которые вы, вероятно, выберете как набор, а не смешайте и сопоставьте. У Amazon, как ведущего поставщика облачных услуг, есть преимущество. Если у вас есть учетная запись AWS, почему бы не попробовать сервисы AI? То же верно и для Microsoft, но не в такой степени. Google, с другой стороны, имеет Chrome и предоставляет конечному пользователю перевод бесплатно. Amazon выдает транскрипцию и синтез голоса как часть Алекса — кто бы ни сказал, что боевые порядки были легкими.