Google сделал доступным криптографический инструмент с открытым исходным кодом под названием Private Join and Compute. Инструмент использует безопасные многосторонние вычисления (MPC) для расширения базового протокола PSI.
Продукт сочетает в себе два криптографических метода — частное пересечение множеств и гомоморфное шифрование. Пересечение частных наборов — это метод, который находит общие идентификаторы в двух наборах данных без необходимости показывать другому владельцу базовые данные. Google использует незаметный вариант, который помечает только зашифрованные идентификаторы, не запоминая ни один из идентификаторов.
Второй метод — гомоморфное шифрование. Он берет зашифрованные данные и выполняет над ними вычисления без необходимости их расшифровки, сохраняя конфиденциальность исходных необработанных данных. На протяжении всего процесса индивидуальные идентификаторы и значения остаются скрытыми. Например, вы можете подсчитать, сколько идентификаторов находится в общем наборе, или вычислить сумму значений, связанных с отмеченными зашифрованными идентификаторами, ничего не узнавая об отдельных лицах.
При совместном использовании обоих методов раскрывается только размер объединенного набора и статистика (например, сумма) связанных с ним значений. Отдельные элементы надежно зашифрованы с помощью случайных ключей и не доступны в необработанном виде другой стороне или кому-либо еще.
Идея состоит в том, что библиотеку можно использовать для работы с наборами данных от независимых сторон, где каждая сторона хранит свою собственную информацию о наборе общих идентификаторов (например, адреса электронной почты), некоторые из которых являются общими, и для получения «совокупной информации» о каждом. другие данные, но никто из них не узнает никакой информации о лицах в наборах данных.
Google говорит, что это:
«изучение ряда потенциальных вариантов использования в рамках совместного машинного обучения, безопасности пользователей и агрегированного измерения рекламы».
Другие предлагаемые варианты использования в основном относятся к категории поиска ответов, где данные не будут доступны из-за проблем с конфиденциальностью, например, каковы долгосрочные последствия для здоровья от использования нового профилактического препарата или снижение количества зарегистрированных автомобилей. аварии, когда производитель автомобилей добавляет к автомобилям более продвинутые функции безопасности.