Репортеру по технологиям Стефани Пауэр нравится думать, что ей комфортно с искусственным интеллектом, но новое поколение говорящих компаньонов с искусственным интеллектом ее нервирует, как она сообщает.
Мой муж — большой поклонник футбольного клуба «Ливерпуль», который впадает в состояние беспокойства почти каждый раз, когда играет.
Это очень раздражает, но недавно я понял, что лучший метод — избегать его до, во время, а иногда и после игры.
Недавно после матча я услышал дружелюбный женский голос, разговаривавший с ним в его домашнем офисе.
«О да, это была тяжелая игра, но красные действительно в хорошей форме», — сказала она. «Нападающие «Ливерпуля» смогли добиться успеха».
Кто была эта женщина? И почему она так потворствовала Дэвиду?
Оказывается, мой муж пробовал приложение под названием Pi.ai. Запущенный в прошлом году американской технологической фирмой Inflection AI, он является примером растущей тенденции под названием диалоговый ИИ.
Вместо того, чтобы просто отвечать на любые вопросы, которые вы ему задаете, или, возможно, делать за вас домашнее задание, идея состоит в том, что ИИ может стать другом или компаньоном, который разговаривает с вами — вслух — через динамики вашего компьютера или телефона.
И чем больше вы общаетесь с ИИ, тем больше он вас понимает, поэтому его ответы стремятся стать более адаптированными для вас и больше походить на естественный разговор с другом. По крайней мере, такова теория.
С Pi.ai вам все равно придется вводить свою половину разговора, но он отвечает одним из шести различных человеческих голосов, которые вы можете выбрать. Они варьируются от быстро говорящего американца до шикарного английского женского голоса, с которым разговаривал мой муж.
Если ваша реакция такая: «Но Alexa от Amazon уже много лет говорит со мной вслух», разговорный ИИ может дать вам гораздо более естественный и плавный разговор, как с точки зрения слов и предложений, которые выбирает ИИ, так и с точки зрения способа он произносит их вслух.
«Люди могут сказать, что у нас уже много лет есть право голоса в сфере технологий, и они, вероятно, думают об Alexa», — говорит Дэвид Рид, профессор искусственного интеллекта в Ливерпульском университете Хоуп и человек, который случайно оказался моим Одержимый Ливерпулем муж.
«Но ожидается, что в ближайшие пять лет мировой рынок диалогового искусственного интеллекта вырастет до 30 миллиардов долларов [24 миллиарда фунтов стерлингов]. Если вы хотите представить, как это может выглядеть, представьте себе Alexa, но с сочувствием».
Tech Fire теперь спешит выпустить своих собственных собеседников с искусственным интеллектом. У Google есть Vertex AI Conversation, у Microsoft есть Azure AI, и сейчас в этом секторе существует множество стартапов.
Между тем, Amazon придерживается Alexa, но планирует добавить к ней разговорный искусственный интеллект, а также голос, более похожий на человеческий.
Рохит Прасад, главный научный сотрудник Alexa, объяснил свои надежды, используя еще одну спортивную аналогию, в своей прошлогодней речи. «[Бостон] Ред Сокс – моя любимая [бейсбольная] команда», – сказал он. «Представьте, если бы они выиграли, то Алекса ответила бы радостным голосом. Если бы они проиграли, мне было бы сочувственно».
Создание человеческих голосов для разговорного ИИ обычно начинается с записи реального человека. Однако затем технология должна иметь возможность адаптировать это, чтобы передать необходимый тон или громкость, чтобы слова звучали естественно.
«Наши инструменты учитывают дух предложения и то, как слова связаны друг с другом», – говорит Мати Станишевски, руководитель Eleven Labs, британской технологической фирмы, которая создала 40 голосов искусственного интеллекта для разных полов и возрастов. и акцент. «Это означает, что мы можем уловить интонацию, тон и эмоции, которые хочет передать ИИ-спикер».
Станишевский говорит, что интонация «жизненно важна».
«Правильное понимание этого вопроса мешает ИИ выглядеть роботизированным. Эмоции и интонация часто должны растягиваться и резонировать в нескольких предложениях, чтобы связать воедино определенный ход мыслей. А тон и темп передают намерение, поэтому модель принимает окружающий контекст, поддерживая правильный поток».
Тревор Кокс, профессор акустической инженерии Солфордского университета, говорит, что разработчики диалогового ИИ, скорее всего, будут избегать сильных региональных акцентов.
«До сих пор существуют предубеждения относительно сильных региональных акцентов», — говорит он. «Исследования показывают, что чем труднее понять голос, тем меньше вероятность, что мы поверим тому, что говорят.
«Речь идет не только об акценте, но и о потоке. Наш мозг хочет быстро декодировать информацию. Поэтому создатели ИИ захотят убедиться, что у мозга есть доступ к такому быстрому декодированию.
«За этим стоит тон. Сообщения передаются гораздо больше, чем слова, важно то, как вы их произносите. Так что, если ИИ может передавать счастье, возбуждение или скуку, тогда все это помогает».
Дэвид Харли, преподаватель киберпсихологии в Брайтонском университете, говорит, что существуют риски, поскольку компьютерные голоса становятся все более похожими на человеческие.
«Меня беспокоит тот факт, что люди могут начать рассматривать ИИ-компаньонов и терапевтов как эффективных в решении всех жизненных проблем», — говорит он. «Они могут начать строить свою жизнь вокруг советов ИИ, который слеп к другим глубоким аспектам человеческого бытия».
Он добавляет, что людям придется напоминать себе, что их ИИ-компаньон не является реальным человеком.
Прочтите дополнительные истории об искусственном интеллекте
Я сам немного поэкспериментировал с Pi.ai и нашел его немного подобострастным, как друг, который просто соглашается со всем, что вы говорите.
Профессор Рид, он же моя вторая половинка, говорит, что так оно и было задумано. «То, что вы называете подобострастием, я считаю дружелюбным и благосклонным.
«Я вижу, что разговорный ИИ действительно ценен в таких условиях, как дом престарелых, где люди получают радость от воспоминаний о прошлом с помощью чего-то знающего. Или колл-центр, где ИИ может понять, когда звонящий расстраивается, и реагируйте соответственно».
Или, возможно, помогая поддерживать тысячи отношений по всему миру, предоставляя терапию перегруженным фанатам футбола и бейсбола от Ливерпуля до Бостона и за его пределами.