В Mozilla DeepSpeech добавлена поддержка TensorFlow Lite, что привело к уменьшению размера пакета и повышению производительности на некоторых платформах.
DeepSpeech — это механизм автоматического распознавания речи (ASR), основанный на глубоком изучении, с простым API, разработанный Mozilla. Технология распознавания речи и обученные модели в DeepSpeech открыты для разработчиков. Mozilla также предоставляет предварительно обученные модели английского языка.
Последний выпуск, версия v0.6, поддерживает TensorFlow Lite, версию TensorFlow, оптимизированную для мобильных и встроенных устройств. Это уменьшило размер пакета DeepSpeech с 98 МБ до 3,7 МБ и уменьшило размер английской модели с 188 МБ до 47 МБ. Разработчики добились сокращения, используя квантование после обучения, метод сжатия весов моделей после завершения обучения.
Хотя TensorFlow Lite разработан для мобильных и встроенных устройств, команда DeepSpeech обнаружила, что он также сделал DeepSpeech быстрее на настольных платформах, поэтому они сделали его доступным для Windows, macOS и Linux, а также для Raspberry Pi и Android. DeepSpeech v0.6 с TensorFlow Lite работает быстрее, чем в реальном времени на одном ядре Raspberry Pi 4. Он также использует в 22 раза меньше памяти.
Переход на TensorFlow 1.14 означает, что разработчики смогли использовать API CuDNN RNN для своего обучающего кода. Это изменение позволило им примерно в два раза сократить время обучения, что означает более быстрые эксперименты и лучшие модели. Также была добавлена поддержка онлайн-расширения функций.
Наряду с улучшением производительности новый декодер предоставляет метаданные времени и достоверности, предоставляя новые возможности для приложений. Новый выпуск также включает расширенный набор функций в API, а не только текстовую расшифровку. Вы также получаете информацию о времени метаданных для каждого символа в расшифровке и значение достоверности для каждого предложения.
DeepSpeech v0.6 теперь предлагает пакеты для Windows с привязками .NET, Python, JavaScript и C. Пакет .NET доступен в галерее NuGet, и вы можете установить его прямо из Visual Studio.