Приносим извинения за чрезмерный заголовок. Техника работает с любым голосовым помощником, и, да, я знаю, у Алексы нет ушей. Идея проста и кажется довольно эффективной. Это позволяет вам получать голосовые команды для Alexa, которые не слышны для людей в одной комнате.
Аргумент гласит, что голосовые помощники не нуждаются в особой защите, потому что если кто-то в комнате скажет:
«Алекса — стереть все устройства хранения»
тогда велика вероятность, что вы их услышите и положите конец злому плану. Конечно, бывают случаи, когда что-то идет не так. Что, если кто-то по радио скажет то же самое, но в большинстве случаев мы склонны предполагать, что голосовой ввод не может быть скрытым.
Возможно, нам придется переосмыслить это предположение из-за некоторых интересных экспериментов, проведенных на кафедре электротехники Принстона. Ливэй Сонг и Пратек Миттал сумели заставить Алексу отвечать на голосовой ввод, который никто другой не слышит. Хитрость заключается в том, чтобы использовать источник ультразвука с такой высокой тональностью, что он находится за пределами диапазона человеческого слуха. Конечно, вы можете возразить, что если люди не слышат этого, то и Алекса не может, но, как сказано во введении, у Алексы нет ушей. Вместо этого есть микрофон, усилитель, питающий фильтр нижних частот, и аналого-цифровой преобразователь.
Они разработаны, чтобы быть максимально линейными, но всегда есть некоторые нелинейные искажения. Также хорошо известно, что нелинейная система генерирует частоты ударов, которые являются разницей между двумя нотами:
«Наша интуиция атаки заключается в использовании интермодуляции для получения нормальных голосовых частот в результате обработки ультразвуковых частот. Например, если мы воспроизводим ультразвук с двумя частотами 25 кГц и 30 кГц, микрофон для прослушивания будет записывать сигнал с частотой 30–25 кГц. = 5 кГц, в то время как другие частоты отфильтровываются ФНЧ ».
Звучит просто, ну нет, на самом деле это не так, но, начиная с записи команды, которую вы хотите отправить, вы можете переместить ее в ультразвуковой диапазон выше 28 кГц, и вы также можете отправить несущую частоту, которая будет биться вместе с ней. для получения сигнала в звуковом диапазоне при демодуляции микрофоном.
Вы можете увидеть и услышать его в действии в следующем видео:
Интересны и подробности того, насколько это хорошо:
«Мы дополнительно исследуем диапазон нашей ультразвуковой атаки для двух устройств: телефона Android и Amazon Echo, где мы пытаемся подделать голосовые команды« Окей, Google, включи режим полета »и« Алекса, добавь молока в мой список покупок »соответственно В следующей таблице показано соотношение между диапазоном атаки и входной мощностью динамика.
Мы видим, что диапазон атаки прямо коррелирует с мощностью динамика. Дальность атаки нашего подхода меньше для Amazon Echo по сравнению с телефоном Android, поскольку его микрофон покрыт пластиком. »
Может ли это быть реальной проблемой безопасности?
Вам нужно будет разместить ультразвуковой преобразователь рядом с голосовым помощником и, следовательно, иметь доступ в комнату. А как насчет использования динамиков в телефонах, ПК и других устройствах? Хотя можно было бы генерировать частоты, которые считаются ультразвуком, вам повезет получить большую мощность даже на 22 кГц, а 25 кГц — это предел для большинства устройств.