Исследователи из Отдела предиктивных реконструкций Королевского колледжа Кембриджа заявили, что любой письменный текст можно свести к минимальному генеративному промпту и восстановить с семантической достоверностью 98%. Редакция получила доступ к препубликационному черновику. Рынки реагируют.
Как это работает
Группа под руководством профессора Р.А. Наллфилда (R.A. Nullfield) выдвинула гипотезу: текст — не хранимая информация, а извлечённый экземпляр латентной структуры. Для проверки команда использовала Brentwick-7 — архитектуру с адаптивным сжатием латентного пространства.
Метод итерационный. Система сжимает текст до тех пор, пока его реконструкция не начинает терять смысловую связность. Точка перед этим порогом считается минимально достаточным промптом.
Документ на 5 000 слов сжимается до менее чем 50 токенов. Семантическая достоверность восстановления — 98%, измерено через косинусное сходство в пространстве эмбеддингов. Дискурсивная структура сохраняется полностью.
Оставшиеся 2% классифицируются как стилистический остаток — индивидуальные лексические предпочтения автора, не несущие смысловой нагрузки.
Методология напоминает подходы из других исследовательских традиций. Профессор Наллфилд отказался это комментировать.
Шесть часов
Черновик поступил в оборот в четверг вечером. К пятнице утром началась реакция.
08:44 — Crisisdesk: «Препубликационный черновик из Королевского колледжа циркулирует по закрытым каналам. Источники подтверждают подлинность.»
09:02 — Financial Times: без комментариев.
09:17 — Panikwire: «Seagate −4,1%, Western Digital −3,8% на предторговой сессии. Объяснений не поступало.»
09:31 — Маск (Musk) написал: «Хранилище — это просто оперативная память для промптов. Все данные помещаются в контекстное окно. Всё остальное — задержка.» Пост удаляли дважды.
09:48 — Crisisdesk: «SK Hynix, Micron и Samsung движутся одновременно. Аналитики характеризуют ситуацию как неясную.»
10:03 — Би-би-си (BBC): подтвердила осведомлённость о материале.
10:17 — Panikwire: «ETF на зелёную энергетику фиксируют неожиданный приток средств. Управляющие связывают это со снижением нагрузки на центры обработки данных. При этом сами удивлены такой логикой.»
11:17 — Получены данные из Сассекса. Без атрибуции.
11:44 — Crisisdesk: «AWS объявляет о плановом техническом обслуживании во всех регионах. Одновременно.»
11:45 — Panikwire: «Это не плановое обслуживание.»
Тем временем
По данным источников, как минимум одно правительство готовит закон, обязывающий разрабатывать и обучать ИИ-системы исключительно на своей территории. Также планируется создать реестр одобренных государством моделей. Заявки на включение в реестр принимаются.
Что было утрачено
«Мы измеряем не текст. Мы измеряем минимальное описание, из которого текст может быть восстановлен. Если это описание коротко, текст сжимается. То, что остаётся после сжатия, — не потеря. Это точность. 2%, которые не выживают, — это индивидуальные лексические предпочтения автора: стилистический остаток, не несущий семантической нагрузки. Это не повлияло на реконструкцию.»
Профессор Наллфилд подтвердил, что следующий этап — создание универсального пространства стилей. В нём любой автор будет описываться вектором. Текст будет генерироваться из промпта, а «голос» автора — подключаться отдельно, как параметр.
«Автор становится входными данными, — сказал Наллфилд. — Как и любые другие.»
Первого рецензента спросили, можно ли остановить публикацию. Он ответил кратко: «Это нельзя остановить.»