Новая система искусственного интеллекта автоматически развивается, чтобы избежать цензуры в Интернете


Интернет-цензура со стороны авторитарных правительств запрещает свободный и открытый доступ к информации миллионам людей во всем мире. Попытки избежать такой цензуры превратились в постоянно усиливающуюся гонку за постоянно меняющуюся и все более изощренную цензуру в Интернете. Режимы цензуры имеют преимущество в этой гонке, потому что исследователи должны вручную искать способы обойти цензуру, а этот процесс занимает значительное время.

Новая работа, проведенная учеными-компьютерщиками Мэрилендского университета, может изменить баланс гонки цензуры. Исследователи разработали инструмент под названием Geneva (сокращение от Genetic Evasion), который автоматически учится обходить цензуру. Женева, опробованная в Китае, Индии и Казахстане, нашла десятки способов обойти цензуру, используя пробелы в логике цензуры и обнаруживая ошибки, которые, по словам исследователей, было бы практически невозможно найти вручную.

Исследователи представят Женеву во время рецензируемого выступления на 26-й конференции Ассоциации вычислительной техники по компьютерной и коммуникационной безопасности в Лондоне 14 ноября 2019 г.

«Благодаря Женеве мы впервые получили серьезное преимущество в гонке цензурных вооружений», — сказал Дэйв Левин, доцент кафедры информатики UMD и старший автор статьи. «Женева представляет собой первый шаг к совершенно новой гонке вооружений, в которой системы искусственного интеллекта цензоров и уклоняющихся конкурируют друг с другом. В конечном счете, победа в этой гонке означает предоставление свободы слова и открытого общения миллионам пользователей по всему миру, которые в настоящее время этого не делают. есть их. «

Вся информация в Интернете разбивается на пакеты данных компьютером отправителя и повторно собирается компьютером-получателем. Одна из распространенных форм интернет-цензуры, используемая авторитарными режимами, заключается в отслеживании пакетов данных, отправляемых во время интернет-поиска. Цензор блокирует запросы, содержащие помеченные ключевые слова (например, «Площадь Тяньаньмэнь» в Китае) или запрещенные доменные имена (например, «Википедия» во многих странах).

Когда Женева работает на компьютере, который отправляет веб-запросы через цензуру, Женева изменяет способ разбивки и отправки данных, чтобы цензор не распознавал запрещенный контент или не мог цензурировать соединение.

Известный как генетический алгоритм, Женева — это биологически вдохновленный тип искусственного интеллекта, который Левин и его команда разработали для работы в фоновом режиме, когда пользователь просматривает веб-страницы в стандартном интернет-браузере. Подобно биологическим системам, Женева формирует наборы инструкций из генетических строительных блоков. Но вместо того, чтобы использовать ДНК в качестве строительных блоков, Женева использует небольшие фрагменты кода. По отдельности части кода делают очень мало, но когда они объединены в инструкции, они могут выполнять сложные стратегии уклонения для разбиения, упорядочивания или отправки пакетов данных.

Женева развивает свой генетический код через последовательные попытки (или поколения). С каждым поколением Женева соблюдает инструкции, которые лучше всего работают для обхода цензуры, и отказывается от остальных. Женева видоизменяет и скрещивает свои стратегии, случайным образом удаляя инструкции, добавляя новые инструкции или комбинируя успешные инструкции и снова тестируя стратегию. Благодаря этому эволюционному процессу Женева может очень быстро определить несколько стратегий уклонения.

«Это полностью меняет подход исследователей к проблеме цензуры», — сказал Левин, работающий по совместительству в Институте передовых компьютерных исследований Мэрилендского университета. «Обычно мы определяем, как работает стратегия цензуры, а затем разрабатываем стратегии для ее обхода. Но теперь мы позволяем Женеве выяснить, как обойти цензуру, а затем мы узнаем, какие стратегии цензуры используются, наблюдая, как Женева победила их».

Команда протестировала Женеву в лаборатории на фиктивные цензоры и в реальном мире на настоящих цензоров. В лаборатории исследователи разработали цензоры, которые функционировали так же, как те, которые, как известно из предыдущих исследований, использовались авторитарными режимами. В считанные дни Женева определила практически все стратегии манипулирования пакетами, которые были обнаружены в ранее опубликованных работах.

Чтобы продемонстрировать, что Женева работает в реальном мире против неизвестных стратегий цензуры, команда запустила Женеву на компьютере в Китае с установленным немодифицированным браузером Google Chrome. Развернув стратегии, определенные Женевой, пользователь мог просматривать страницы без цензуры ключевых слов. Исследователи также успешно избежали цензуры в Индии, которая блокировала запрещенные URL-адреса, и в Казахстане, где в то время осуществлялось прослушивание определенных сайтов социальных сетей. Во всех случаях Женева успешно обходила цензуру.

«В настоящее время цикл« уклонение-обнаружение »требует обширных ручных измерений, обратной инженерии и творческого подхода для разработки новых средств обхода цензуры», — сказал Кевин Бок (BS ’17, MS ’18, информатика), доктор компьютерных наук. Д. студент UMD и ведущий автор статьи. «Благодаря этому исследованию Женева представляет собой важный первый шаг в автоматизации уклонения от цензуры».

Исследователи планируют опубликовать свои данные и код в надежде, что это предоставит открытый доступ к информации в странах, где ограничен доступ в Интернет. Команда признает, что может быть много причин, по которым люди, живущие при автократических режимах, могут не захотеть или не смогут установить этот инструмент на свои компьютеры. Однако их это не остановило. Исследователи изучают возможность развертывания Geneva на компьютере, поставляющем заблокированный контент (известный как сервер), а не на компьютере, который ищет заблокированный контент (известный как клиент). Это будет означать, что такие веб-сайты, как Википедия или BBC, могут быть доступны для всех внутри стран, которые в настоящее время их блокируют, таких как Китай и Иран, без необходимости настраивать что-либо на своем компьютере.

«Если Женева может быть развернута на стороне сервера и работать так же хорошо, как и на стороне клиента, то потенциально она может открыть коммуникацию для миллионов людей», — сказал Левин. «Это потрясающая возможность, и мы движемся в этом направлении».


Добавить комментарий