Google сообщил, что теперь ИИ играет важную роль в его результатах поиска. У нас мало информации о том, что именно он делает и как работает, но это начало чего-то большого.
По сути, поиск — проблема прикладного интеллекта. Когда-то люди привыкли организовывать вещи, которые они находили в сети, так, чтобы другие могли их находить, но вскоре сеть стала слишком большой, чтобы ручной поиск работал. Google нашел способ делать все автоматически, когда его основатели Сергей Брин и Ларри Пейдж изобрели PageRank — способ использования статистики ссылок для определения важности страницы для той или иной поисковой темы.
Что широко не ценится, так это то, что Google больше не полагается на PageRank — если он вообще его использует. Вместо этого алгоритм поиска Google основан на большом наборе «сигналов», которые объединяются, чтобы указать, насколько важна страница. Эти сигналы в основном являются специальными и создаются инженерами Google по принципу «попробуй и посмотри, что получится».
В недавнем интервью Bloomberg выяснилось, что Google использует сигнал на основе ИИ — RankBrain — в течение последних нескольких месяцев. Это неудивительно, поскольку всегда было ясно, что часть обширного интереса Google к ИИ выходит за рамки беспилотных автомобилей и классификации видеороликов о кошках на YouTube, а также в его основной поисковый бизнес.
Также очевидно, что поиск — это то, что действительно требует ИИ для правильной работы. Если пользователь вводит сложный запрос, то ИИ — это то, что нужно, чтобы выяснить, о чем идет речь, и найти страницы по теме. Вы также можете видеть, что ИИ можно использовать для ранжирования качества страниц по теме — вам не нужен рейтинг страницы, достаточно интеллекта, чтобы определить, является ли страница качественной информацией или нет.
Похоже, что RankBrain работает с поисковыми запросами, которые Google раньше не видел, около 15% от общего числа запросов.
Хотя у нас нет подробностей о том, что делает RankBrain — Google очень скрытно рассказывает о том, как работает его поисковая система по очевидным причинам — похоже, она основана на Word2vec. Это метод, который использует неглубокую нейронную сеть для определения того, как слова соотносятся друг с другом. Его изобрели исследователи искусственного интеллекта Google во главе с Томасом Миколо. Нейронная сеть принимает входные слова и сопоставляет каждое слово с вектором в многомерном пространстве. То, как это делается, улавливает многие семантические отношения между словами, так что слова, которые означают похожие вещи, соответствуют векторам в том же направлении в пространстве, и они фиксируют множество закономерностей. Например, векторная операция:
вектор (‘король’) — вектор (‘мужчина’) + вектор (‘женщина’)
близка к вектору («ферзь») и так далее.
Похоже, что RankBrain выполняет семантическую обработку входящего запроса, позволяя алгоритму поиска возвращать страницы, более соответствующие запросу. Похоже, это не имеет никакого отношения к ранжированию важности страниц.
Тем не менее, RankBrain удивил своих создателей, став за несколько коротких месяцев третьим по важности сигналом среди сотен, которые использует алгоритм поиска.
ИИ, помогая связать неоднозначные поисковые фразы с релевантными страницами, несомненно, углубится в ядро поиска Google и в конечном итоге заменит сотни специальных сигналов, которые используются в настоящее время.
Когда это произойдет, поиск в Google перестанет быть постоянным занятием, с которым мы в настоящее время мирились. Вы сможете задать вопрос, и поисковая система действительно предоставит вам самые актуальные и качественные страницы. Именно тогда, наконец, станет очевидным истинное влияние Интернета на человеческий интеллект.