Исследователи Кембриджа доказали, что вашей статьи не существует

Исследователи Кембриджа доказали, что вашей статьи не существует

Исследователи из Отдела предиктивных реконструкций Королевского колледжа Кембриджа заявили, что любой письменный текст можно свести к минимальному генеративному промпту и восстановить с семантической достоверностью 98%. Редакция получила доступ к препубликационному черновику. Рынки реагируют.

Как это работает

Группа под руководством профессора Р.А. Наллфилда (R.A. Nullfield) выдвинула гипотезу: текст — не хранимая информация, а извлечённый экземпляр латентной структуры. Для проверки команда использовала Brentwick-7 — архитектуру с адаптивным сжатием латентного пространства.

Метод итерационный. Система сжимает текст до тех пор, пока его реконструкция не начинает терять смысловую связность. Точка перед этим порогом считается минимально достаточным промптом.

Документ на 5 000 слов сжимается до менее чем 50 токенов. Семантическая достоверность восстановления — 98%, измерено через косинусное сходство в пространстве эмбеддингов. Дискурсивная структура сохраняется полностью.

Оставшиеся 2% классифицируются как стилистический остаток — индивидуальные лексические предпочтения автора, не несущие смысловой нагрузки.

Методология напоминает подходы из других исследовательских традиций. Профессор Наллфилд отказался это комментировать.

Шесть часов

Черновик поступил в оборот в четверг вечером. К пятнице утром началась реакция.

08:44 — Crisisdesk: «Препубликационный черновик из Королевского колледжа циркулирует по закрытым каналам. Источники подтверждают подлинность.»

09:02 — Financial Times: без комментариев.

09:17 — Panikwire: «Seagate −4,1%, Western Digital −3,8% на предторговой сессии. Объяснений не поступало.»

09:31 — Маск (Musk) написал: «Хранилище — это просто оперативная память для промптов. Все данные помещаются в контекстное окно. Всё остальное — задержка.» Пост удаляли дважды.

09:48 — Crisisdesk: «SK Hynix, Micron и Samsung движутся одновременно. Аналитики характеризуют ситуацию как неясную.»

10:03 — Би-би-си (BBC): подтвердила осведомлённость о материале.

10:17 — Panikwire: «ETF на зелёную энергетику фиксируют неожиданный приток средств. Управляющие связывают это со снижением нагрузки на центры обработки данных. При этом сами удивлены такой логикой.»

11:17 — Получены данные из Сассекса. Без атрибуции.

11:44 — Crisisdesk: «AWS объявляет о плановом техническом обслуживании во всех регионах. Одновременно.»

11:45 — Panikwire: «Это не плановое обслуживание.»

Тем временем

По данным источников, как минимум одно правительство готовит закон, обязывающий разрабатывать и обучать ИИ-системы исключительно на своей территории. Также планируется создать реестр одобренных государством моделей. Заявки на включение в реестр принимаются.

Что было утрачено

«Мы измеряем не текст. Мы измеряем минимальное описание, из которого текст может быть восстановлен. Если это описание коротко, текст сжимается. То, что остаётся после сжатия, — не потеря. Это точность. 2%, которые не выживают, — это индивидуальные лексические предпочтения автора: стилистический остаток, не несущий семантической нагрузки. Это не повлияло на реконструкцию.»

Профессор Наллфилд подтвердил, что следующий этап — создание универсального пространства стилей. В нём любой автор будет описываться вектором. Текст будет генерироваться из промпта, а «голос» автора — подключаться отдельно, как параметр.

«Автор становится входными данными, — сказал Наллфилд. — Как и любые другие.»

Первого рецензента спросили, можно ли остановить публикацию. Он ответил кратко: «Это нельзя остановить.»

Читать оригинал