Защита конфиденциальных данных — одна из главных проблем при работе с крупными языковыми моделями (LLM). Передача корпоративных секретов, исходного кода, персональных данных сотрудников или медицинской информации в облачные сервисы сопряжена с рисками. Вендоры могут использовать эти данные для дообучения моделей, что фактически делает их доступными для третьих лиц.
Гомоморфное шифрование
Гомоморфное шифрование — форма шифрования, позволяющая выполнять математические операции с зашифрованными данными и получать зашифрованный результат, соответствующий операциям над открытыми данными. Например, можно сложить два зашифрованных числа, не зная их значений, и получить зашифрованную сумму. Это позволяет обрабатывать данные без их раскрытия.
Полностью гомоморфное шифрование (Fully Homomorphic Encryption, FHE) решает эту проблему. Оно обеспечивает зашифрованный канал между клиентом и сервером, где обработка данных происходит в зашифрованном виде. LLM-сервер получает зашифрованный запрос и возвращает зашифрованный ответ, не имея возможности расшифровать ни то, ни другое.
FHE основано на криптографии на решётках (lattice-based cryptography) и схеме обучения с ошибками (Learning with Errors, LWE). По сути, это математическая трансформация, аналогичная преобразованию Фурье. Алгоритм устойчив к атакам квантовых компьютеров и даёт те же результаты на зашифрованных данных, что и обычные операции на открытых.
В клиент-серверной архитектуре это означает, что функция f(x) может выполняться над зашифрованным x без его расшифровки.
FHE поддерживает два типа операций — сложение и умножение. В отличие от частично гомоморфных систем, где доступна только одна операция, FHE позволяет строить сложные вычисления.
Проблемы производительности в FHE
Главный недостаток FHE — низкая производительность. Вычисления над зашифрованными данными могут быть в десятки тысяч раз медленнее, чем на обычных CPU и GPU. Одна из причин — значительный рост объёма данных: зашифрованный текст в FHE может быть в десятки раз больше исходного.
Операции сложения и умножения целых чисел в FHE требуют примерно в 10 000 раз больше тактовых циклов. Современные CPU неэффективны для таких задач из-за ограниченной способности к параллелизации.
GPU, хотя и хорошо справляются с параллельными вычислениями, не оптимизированы для работы с 64-битной точностью, необходимой в FHE. Кроме того, в FHE используются специфические операции, такие как автоморфизм и бустраппинг — подавление шума в зашифрованных данных, требующее огромных вычислительных ресурсов.
Эти особенности делают аппаратное ускорение необходимым. Университеты и стартапы активно разрабатывают специализированные чипы для FHE.
Микросхема Heracles
В феврале 2026 года на Международной конференции по твердотельным схемам IEEE (ISSCC) в Сан-Франциско компания Intel представила прототип микросхемы Heracles — первого серверного ускорителя FHE, готового к массовому производству.
В отличие от экспериментальных чипов площадью до 10 мм², Heracles в 20 раз больше. Он изготовлен по 3-нм FinFET-технологии и упакован в корпус с жидким охлаждением и двумя модулями памяти по 24 ГБ — конфигурация, типичная для GPU, используемых в обучении ИИ.
Разработка велась в рамках программы DARPA по ускорению FHE с помощью специализированного оборудования.
В центре чипа — 64 вычислительных ядра, организованных в сетку 8×8 («пары плиток»). Это SIMD-движки, оптимизированные для полиномиальной математики и других операций FHE. Плитки соединены 2D-сетевой топологией с 512-байтными шинами.
Для обработки больших объёмов данных чип поддерживает 48 ГБ высокоскоростной памяти с пропускной способностью 819 ГБ/с. На кристалле также размещено 64 МБ кэша — чуть больше, чем у GPU Nvidia Hopper. Через кэш обеспечивается скорость обмена данными между ядрами до 9,6 ТБ/с.
Чтобы не было конфликта между вычислениями и передачей данных, Heracles одновременно выполняет три синхронизированных потока: I/O (обмен с внешней памятью), внутренний обмен данными и математические операции.
По данным Intel, это обеспечивает огромный прирост производительности. На частоте 1,2 ГГц Heracles выполняет основное математическое преобразование FHE за 39 мкс — в 2355 раз быстрее, чем Intel Xeon с частотой 3,5 ГГц. По семи ключевым операциям ускорение составляет от 1074 до 5547 раз.
Применение в электронных голосованиях
Один из примеров использования FHE — проверка результатов электронного голосования. Избиратель может с помощью своего секретного ключа проверить, что его голос учтён, не раскрывая при этом, за кого он проголосовал. Владелец сервера не может получить доступ к содержимому голосов, так как вся база и ответы зашифрованы.
На сервере с Intel Xeon криптографическая операция FHE занимает 15 мс. На Heracles — всего 14 мкс. Проверка 100 млн бюллетеней займёт 17 дней на обычном CPU и всего 23 минуты на Heracles.
Защита от облака
Ключевое применение FHE-ускорителей — зашифрованный ИИ в облачной инфраструктуре. Помимо Intel, над такими решениями работают и другие компании.
Стартап Niobium Microsystems заключил сделку на $6,9 млн с южнокорейской компанией Semifive для разработки FHE-ускорителя на 8-нм технологической платформе Samsung Foundry.
Аналогичные проекты ведут Fabric Cryptography, Cornami и Optalysys.
Как показали эксперименты стартапа Duality, полностью зашифрованные чат-сессии с LLM уже близки к реализации. В прошлом году компания продемонстрировала работу LLM с шифрованием FHE на базе открытой библиотеки OpenFHE.
Сейчас поддержка ограничена малыми моделями, требующими специальной адаптации. Однако в ближайшие годы такие технологии могут стать доступными для широкой аудитории.
Главное условие — облачный ИИ должен выполнять вычисления исключительно над зашифрованными данными, не имея доступа к расшифрованной информации.