Документы, сделанные командой юристов Илона Маска в его битве с Twitter, были подвергнуты сомнению ведущими исследователями ботов.
Botometer — онлайн-инструмент для отслеживания спама и фейковых аккаунтов — использовался Маском в встречном иске против Twitter.
Используя этот инструмент, команда Маска подсчитала, что 33% «видимых учетных записей» на платформе социальных сетей были «ложными или спам-аккаунтами».
Однако создатель и сопровождающий Botometer Кайчэн Ян сказал, что эта цифра «ничего не значит».
Ян поставил под сомнение методологию, используемую командой Маска, и сказал Би-би-си, что они не обращались к нему до использования инструмента.
Маск в настоящее время находится в споре с Twitter после попытки отказаться от сделки по покупке компании за 44 миллиарда долларов (36,6 миллиарда фунтов стерлингов).
Судебное дело должно состояться в октябре в Делавэре, где судья примет решение о том, придется ли Маску покупать его.
В июле Маск заявил, что больше не хочет покупать компанию, поскольку не может проверить, сколько людей находится на платформе.
С тех пор самый богатый человек в мире неоднократно заявлял, что фейковых и спам-аккаунтов может быть во много раз больше, чем заявлено в Twitter.
В своем встречном иске, обнародованном 5 августа, он утверждал, что треть видимых аккаунтов в Твиттере, по оценке его команды, были поддельными. Используя эту цифру, команда подсчитала, что минимум 10% ежедневных активных пользователей являются ботами.
Twitter говорит, что, по его оценкам, менее 5% его ежедневных активных пользователей являются учетными записями ботов.
Правильный порог
Botometer — это инструмент, который использует несколько индикаторов, например, когда и как часто аккаунт твитит, а также содержание постов, чтобы создать «оценку» бота из пяти.
A score of zero indicates a Twitter account is unlikely to be a bot, and a five suggests that it is unlikely to be a human.
Однако исследователи говорят, что инструмент не дает однозначного ответа на вопрос, является ли учетная запись ботом.
«Чтобы оценить распространенность [ботов], вам нужно выбрать порог, чтобы снизить оценку», — говорит Ян.
«Если вы измените порог с трех на два, вы получите больше ботов и меньше людей. Поэтому то, как выбрать этот порог, является ключом к ответу на вопрос, сколько ботов на платформе».
Ян говорит, что встречный иск Маска не объясняет, какой порог он использовал для достижения своего числа в 33%.
«Это [встречный иск] не проясняет детали, поэтому он [Маск] имеет свободу делать все, что хочет. Так что для меня это число ничего не значит», — сказал он.
Роботизированное поведение
Комментарии вызывают сомнения в том, как команда Маска пришла к своим выводам по количеству ботов на платформе.
BBC передала комментарий Янга юридической команде Маска, но они пока не ответили.
В встречном иске Маска его команда говорит: «Анализ Musk Party был ограничен из-за ограниченных данных, которые предоставил Twitter, и ограниченного времени для анализа этих неполных данных».
Botometer был создан Обсерваторией Университета Индианы в социальных сетях.
Клейтон Дэвис, специалист по данным, работавший над проектом, говорит, что система использует машинное обучение и такие факторы, как регулярность твитов и языковая изменчивость, а также другие явные признаки роботизированного поведения.
«Люди ведут себя определенным образом. Если учетная запись демонстрирует поведение, не похожее на то, как люди ведут себя, то, возможно, это не человек», — говорит он.
Данные есть только в твиттере
Исследователи Botometer попытались подсчитать, сколько спама и поддельных аккаунтов было в Twitter в прошлом.
В 2017 году группа ученых, разработавших этот инструмент, опубликовала статью, в которой оценивалось, что от 9% до 15% активных аккаунтов в Твиттере были ботами.
Тем не менее, Дэвис говорит, что отчет был сильно оговорен и опирался на ограниченные данные.
«Единственный человек, у которого есть точка зрения Бога, — это Твиттер», — говорит Дэвис.
Twitter говорит, что подсчитывает количество поддельных учетных записей, в основном, на основе проверки людьми. Он говорит, что каждый квартал случайным образом выбирает тысячи учетных записей и ищет активность ботов.
В отличие от других общедоступных инструментов анализа ботов, Twitter утверждает, что также использует личные данные, такие как IP-адреса, номера телефонов и геолокацию, для анализа того, является ли учетная запись реальной или поддельной.
Что касается Botometer, Twitter утверждает, что его подход «чрезвычайно ограничен».
В качестве примера приводится учетная запись в Твиттере без указания фотографии или местоположения — красные флажки для общедоступного детектора ботов. Однако владельцем учетной записи может быть кто-то, кто серьезно относится к конфиденциальности.
Неудивительно, что Twitter заявляет, что его способ — лучшая система для оценки количества существующих поддельных учетных записей.
Майкл Кирни, создатель Tweet Bot or Not, еще одного общедоступного инструмента для оценки ботов, сказал Би-би-си, что количество спама и поддельных учетных записей в Twitter частично сводится к определению.
Боты твитят больше
«В зависимости от того, как вы определяете бота, у вас может быть от менее 1% до 20%», — говорит он.
«Я думаю, что строгое определение было бы довольно низким числом. Вы должны учитывать такие вещи, как учетные записи ботов, которые действительно существуют, твиты в гораздо больших объемах», — сказал он.
Общепринятого определения бота не существует. Например, является ли учетная запись Twitter, которая публикует автоматические твиты, но управляется человеком, — это бот?
Поддельными учетными записями часто управляют люди, в то время как такие учетные записи, как погодные боты, активно поощряются в Твиттере.
Несмотря на эту проблему с определением, Twitter заявляет, что ежедневно обнаруживает и удаляет более миллиона учетных записей ботов с помощью автоматизированных инструментов.
Но его система не улавливает их всех, и Twitter признает, что через сеть проскальзывают миллионы учетных записей. Тем не менее, он говорит, что они составляют относительно небольшую долю от 217 миллионов активных пользователей в день.
Личная заинтересованность
Некоторые эксперты по ботам утверждают, что Twitter заинтересован в занижении числа поддельных учетных записей.
«У Twitter несколько противоречивые приоритеты, — говорит Дэвис.
«С одной стороны, они заботятся о доверии. Они хотят, чтобы люди думали, что действия в Твиттере реальны. Но они также заботятся о большом количестве пользователей».
Подавляющее большинство доходов Twitter поступает от рекламы, и чем больше у него активных пользователей в день, тем больше он может взимать с рекламодателей.
Кирни считает, что Twitter мог бы создать более мощные инструменты для поиска поддельных учетных записей.
«Twitter, возможно, не использует все технологии, которые они могли бы использовать, чтобы получить самый четкий ответ», — говорит он.
Команда юристов Маска в своем встречном иске заявляет, что Twitter должен использовать более сложную технологию для оценки активности ботов.
Он также обвиняет Twitter в том, что он не предоставил ему достаточно пользовательских данных для независимой проверки оценок ботов.
Ян, однако, считает, что методология Twitter относительно надежна, и говорит, что если бы у него были данные, он «вероятно сделал бы что-то похожее на Twitter» для проверки учетных записей.
Но он также согласился с тем, что характеристики бота необходимо лучше определить.
«Важно, чтобы люди с обеих сторон сели вместе и просмотрели учетные записи один за другим», — говорит он, — чтобы согласовать принятое определение бота.
Однако обе стороны, кажется, закончили говорить. В октябре в суде Делавэра мы получим более четкое представление о том, кого судья считает правым.