Когда вы ищете что-то в Интернете, вы пролистываете страницу за страницей с предложениями или выбираете из нескольких вариантов?
Поскольку большинство людей выбирают из первых мест в этих списках, они редко видят подавляющее большинство вариантов, что создает потенциал для предвзятости во всем, от приема на работу до воздействия средств массовой информации на электронную коммерцию.
В новой статье исследователи Корнельского университета представляют инструмент, который они разработали для повышения справедливости онлайн-рейтингов, не жертвуя при этом их полезностью или актуальностью.
«Если бы вы могли одинаково изучить все свои варианты выбора, а затем решить, что выбрать, это можно было бы считать идеальным. Но поскольку мы не можем этого сделать, рейтинги становятся важным интерфейсом для навигации по этим вариантам», — сказал докторант информатики. Ашудип Сингх, соавтор книги «Контроль справедливости и предвзятости в динамическом обучении по рангу», получившей награду за лучшую работу на конференции Ассоциации вычислительной техники SIGIR по исследованиям и разработкам в области информационного поиска.
«Например, многие пользователи YouTube публикуют видео с одним и тем же рецептом, но некоторые из них видят больше, чем другие, даже если они могут быть очень похожи», — сказал Сингх. «И это происходит из-за того, как нам представляются результаты поиска. Обычно мы опускаемся в рейтинге линейно, и наше внимание быстро падает».
Метод исследователей, получивший название FairCo, дает примерно равные возможности для одинаково релевантных вариантов и позволяет избежать преференциального отношения к элементам, которые уже находятся в первых рядах. Это может исправить несправедливость, присущую существующим алгоритмам, которая может усугубить неравенство и политическую поляризацию, а также ограничить личный выбор.
«Какие системы ранжирования делают, они распределяют воздействие. Итак, как мы можем гарантировать, что каждый получает свою справедливую долю воздействия?» сказал Торстен Йоахимс, профессор информатики и информатики и старший автор статьи. «То, что представляет собой справедливость, вероятно, сильно отличается, скажем, в системе электронной коммерции и системе, которая оценивает резюме для открытия вакансии. Мы придумали вычислительные инструменты, которые позволяют указать критерии справедливости, а также алгоритм, который будет обеспечивать их».
Алгоритмы ищут элементы, наиболее релевантные для поисковиков, но поскольку подавляющее большинство людей выбирают один из первых нескольких элементов в списке, небольшие различия в релевантности могут привести к огромным расхождениям в показе. Например, если 51% читателей новостного издания предпочитают статьи, которые искажают консервативные взгляды, а 49% предпочитают более либеральные эссе, все главные статьи, выделенные на главной странице, могут быть предположительно консервативными, согласно газете.
«Когда небольшие различия в релевантности приводят к усилению одной стороны, это часто вызывает поляризацию, когда одни люди склонны доминировать в разговоре, а другие мнения отбрасываются без должной доли внимания», — сказал Иоахимс. «Возможно, вы захотите использовать его в системе электронной коммерции, чтобы убедиться, что если вы производите продукт, который нравится 30% людей, вы получаете определенное количество просмотров на основе этого. Или если у вас есть резюме базы данных, вы можете сформулировать меры предосторожности, чтобы гарантировать отсутствие дискриминации по признаку расы или пола».
Исследование было частично поддержано Национальным научным фондом и Workday.