Microsoft представила свою первую публичную демонстрацию голосового перевода почти в реальном времени, которая является результатом совместной работы исследователей Microsoft и инженеров Skype. Хотя демонстрация англо-немецкого перевода имеет паузы и некоторые очевидные недостатки, Сатья Наделла назвал его «волшебным» не далеко от истины.
Microsoft (и Google) уже предоставили технологию для перевода целых веб-страниц. Теперь Microsoft Research сделала дополнительный шаг и работает над объединением технологий голосовой связи Skype и обмена мгновенными сообщениями с Microsoft Translator и распознаванием речи на основе нейронных сетей, что делает Babel Fish Дугласа Адама более или менее реальностью.
Приложение было продемонстрировано на сцене конференции на этой неделе и в ответ на вопрос Уолта Моссберга.
"У этой вещи есть имя?"
Генеральный директор Microsoft Сатья Наделла и Гурдип Полл, вице-президент Skype и руководитель группы, работающей над этой технологией, остановились на Skype Translator.
В обсуждении перед демонстрацией Наделла объясняет, что в течение последних 15 лет команда машинного перевода в Microsoft Research работала в области распознавания и синтеза речи и что этот прорыв произошел благодаря включению подхода глубоких нейронных сетей (DNN). Наделла говорит, что по какой-то причине с каждым последующим языком, на котором вы обучаете систему, тем лучше она становится на уже выученных, комментируя:
«Никто из нас точно не знает, почему это происходит. Это похоже на мозг и волшебство».
Далее он говорит, что технология гарантирует, что вы сможете общаться с кем угодно без языковых барьеров. На самом деле это самое человечное.
Во время демонстрации Полл разговаривает по Skype с немецкоязычной коллегой Дайаной Хайнрихс. Если вы придирчивы, то заметите, что перевод не соответствует немецкому порядку предложений, где глаголы должны стоять в конце предложений. Когда Полл говорит по-английски о планировании переезда в Лондон, приложение использует слово «vershieben» (что в некоторых контекстах означает «переехать», а не «umziehen», что было бы здесь правильным выбором. Аудитория обнаруживает одну ошибку в переводе на английский, когда Похоже, что Диана говорит, что когда она приедет в США, она «воспользуется возможностью увидеть своего жениха моим».
Однако в целом очевидно, что обе стороны разговора могли бы понять друг друга, даже если бы они ни слова не говорили на родном языке друг друга.
Ваш браузер не поддерживает фреймы.
В своем сообщении в блоге Полл резюмирует это, говоря:
Представьте себе, что в самом ближайшем будущем технологии позволят людям преодолеть географические и языковые границы, чтобы соединить разум с разумом и сердце с сердцем способами, которые раньше были невозможны.
Microsoft Research также выпустила видео, в котором рассказывается о некоторых фонах для Skype Translator, включая его предыдущую публичную демонстрацию Риком Рашидом в 2012 году, и снова демонстрирует англо-немецкий разговор.
В конце этого видео Питер Ли, руководитель отдела исследований Microsoft, комментирует:
С помощью переводчика Skype это полное взаимодействие человека с человеком, которое преодолевает языковой барьер. Это поистине волшебный опыт.
Skype Translator сначала будет доступен в виде бета-приложения для Windows 8 до конца 2014 года.