Amazon позволяет нам всем использовать Lex для создания бота


Lex — это сервис преобразования голоса в текст и текст в голос, на котором работает Alexa. Теперь мы все можем использовать его, чтобы без ограничений добавлять голосовые возможности в наши приложения и устройства. Но есть цена.

Lex — это услуга автоматического распознавания речи ASR и понимания естественного языка NLU.
«Тысячи экспертов по машинному обучению и глубокому обучению в Amazon разрабатывают технологии искусственного интеллекта в течение многих лет, и Amazon Alexa включает в себя одни из самых сложных и мощных существующих технологий глубокого обучения», — сказал Раджу Гулабани, вице-президент по базам данных, аналитике и искусственному интеллекту. , AWS.
Lex — это сервис AWS, который интегрируется с AWS Lambda. Это не обычная система преобразования голоса в текст и текста в голос в произвольной форме. Он организован как система для создания чат-ботов. В системе используется тот же подход, что и при создании приложения Alexa. Вы определяете интервалы намерений и высказывания. Высказывания — это набранные или произнесенные фразы, которые вызывают ваши намерения, а слоты определяют данные, необходимые намерению для их выполнения.
Вы можете отправить Lex до 15 секунд речевого ввода, и вам нужно убедиться, что микрофон, который вы используете, подходит для работы. Amazon сделал массив из семи микрофонов, который используется в Alexa, доступным только для приглашенных производителей, поэтому, если вам не повезет, вам придется создавать собственное оборудование ввода. Поддерживаемые форматы ввода — LPCM и Opus. Поддерживаемые аудиоформаты вывода: MPEG, OGG, PCM. Речевой вывод не может использовать голос Алексы, но вы можете выбрать один из семи других голосов.
Еще одна задача, которую вам придется сделать, — это найти замену пробуждающему слову — система не запускается, когда вы говорите Alexa или что-то еще. Вам решать, когда срабатывает микрофон.
Существуют SDK для iOS и Android, которые поддерживают голосовой и текстовый ввод. Взаимодействие осуществляется через REST всего с двумя действиями — PostContent и PostText. Ответ определяется созданным вами ботом — его слотами и высказываниями.

На первый взгляд это очень похоже на использование Alexa, но есть некоторые важные отличия. Во-первых, Amazon не обязана сертифицировать ваше приложение. Вы можете разработать то, что вам нравится, и, поскольку одно из возможных намерений — вернуть проанализированные значения намерения и слота, вы можете реализовать действие локально. Это дает вам больше гибкости, чем позволяет Alexa. Однако стоит знать, что Amazon имеет доступ ко всем вашим данным и хранит записи голосового ввода с целью их использования для улучшения распознавания голоса.
Наконец, самая большая разница между использованием Alexa и Lex заключается в том, что служба Alexa бесплатна, а Lex — платная:
С вас взимается плата в зависимости от количества текстовых или голосовых запросов, обработанных вашим ботом, из расчета 0,004 доллара за голосовой запрос и 0,00075 доллара за текстовый запрос. Например, 1000 речевых запросов будут стоить 4 доллара, а 1000 текстовых запросов — 0,75 доллара.
Вы также можете обрабатывать 10 000 текстовых запросов и 5000 речевых запросов в месяц бесплатно в течение первого года.
Это также позволяет нам оценить стоимость бесплатного использования Alexa для Amazon. Используется не менее 10 миллионов устройств Alexa. Если предположить, что каждый из них в среднем делает 10 голосовых запросов в день — если вы не согласны с оценкой, то сделайте свою собственную — это означает, что, по оценке Amazon, это стоит 12 миллионов долларов в месяц в вычислительной мощности AWS.


Добавить комментарий