Следуя обещанию превратить Bing в платформу, которую разработчики могут использовать для улучшения своих приложений, Microsoft выпустила новые элементы управления для распознавания речи, OCR и перевода.
Сама идея «Bing как платформы» немного странная. Раньше Bing был поисковой системой, а теперь, похоже, он развивается во что-то вроде Google Play Services. Ранее в этом месяце был обновлен Bing Maps SDK, чтобы упростить использование карт приложениями Магазина Windows или WinRT. Теперь у нас есть набор новых элементов управления XAML, которые добавляют распознавание речи, OCR и перевод.
Первый вопрос: что такое элемент управления XAML?
Похоже, что это способ Microsoft сказать, что это элемент управления WinRT. Вы не можете использовать какие-либо из этих новых элементов управления в классическом настольном приложении .NET — ну, возможно, вы можете, но это непросто и не будет поддерживаться. В объявлении очень четко указано, что новые функции предназначены только для Windows 8 / 8.1 или WP8, но вам нужно посмотреть более внимательно, чтобы обнаружить, что это исключает использование настольных приложений.
Для управления распознаванием речи также необходимо, чтобы вы были зарегистрированы в Windows Azure Data Marketplace и получали 500 000 обращений в службу поддержки в месяц бесплатно — после этого вам нужно обсудить тариф с Microsoft. Этот элемент управления преобразует речь в текст и представляет собой службу, отличную от той, которая предоставляет голосовые команды в WP8. Элемент управления распознаванием речи можно использовать с приложениями WinRT на C ++, C # или JavaScript.
Элемент управления OCR используется почти таким же образом и преобразует входной видеосигнал в текст. Пользовательский интерфейс по умолчанию показывает пользователю видеоизображение, и когда пользователь касается области, элемент управления захватывает изображение и возвращает идентифицированный текст и его местоположение в изображении. Оборудование должно иметь камеру, поддерживающую разрешение 1280×720 или 640×480. В этом случае регистрация на Azure Data Marketplace дает вам 5000 бесплатных звонков в месяц. Кажется, можно использовать его с C ++ или C #. но пока не с помощью JavaScript.
Элемент управления Translator работает с C ++, C # и JavaScript, и вы получаете 2 миллиона символов в месяц бесплатно. Вы можете переводить более чем на 40 языков.
Публичность Microsoft подчеркивает, как эти новые элементы управления могут использоваться вместе для создания приложения, которое делает все это — слушает, что вы говорите, переводит его на другой язык, а затем читает условия использования приложения. Все это правда, но что, если вы не хотите просто создавать приложение WinRT или Windows Store?
В Windows был API распознавания речи с управляемым кодом, начиная с Windows XP (в настоящее время он находится в версии 5.4). Для OCR нет Microsoft API для общих приложений или веб-сайтов, только продукты сторонних производителей. API-интерфейс Microsoft Translator также доступен на рынке данных Azure, и его можно использовать для создания ASP.NET и управляемых приложений. Вы также можете использовать веб-виджет, AJAX, HTTP, SOAP или OData, и он имеет те же ограничения в 2 миллиона символов.
Новые элементы управления хорошо вписываются в то, что Microsoft становится компанией, предоставляющей услуги и устройства. На самом деле у него есть конкуренция только со стороны Google в сфере услуг перевода, а Google не предлагает бесплатную квоту. У Google есть OCR API, но он является частью Google Docs и не так широко применим, и единственный поддерживаемый API распознавания речи является частью браузера Chrome. Таким образом, похоже, что Microsoft в настоящее время лучше передает свои передовые технологии программистам.
Большая проблема в том, что Microsoft избирательно выбирает технологии, поддерживаемые ее сервисами, то есть WinRT. Настоящая «сервисная» компания будет пытаться добиться как можно более широкого использования своих сервисов, а не использовать их как рычаг, чтобы сделать свою ОС более привлекательной.