arXiv будет банить исследователей за публикацию статей с AI-мусором

Платформа arXiv, популярный репозиторий научных препринтов, ужесточает правила — теперь авторов будут баниить за публикацию статей, наполненных контентом, сгенерированным языковыми моделями (LLM), без должной проверки.

Жёсткие меры против AI-мусора

Если в статье найдут непроверенные результаты от LLM, такие как вымышленные ссылки или оставленные следы промптов (например, фразы вроде «вот краткое содержание, хотите изменений?»), автора могут заблокировать на целый год.

Об этом сообщил Томас Диттерих (Thomas Dietterich), глава компьютерно-научного отдела arXiv. По его словам, после бана все будущие статьи автора должны будут сначала пройти рецензирование в авторитетном научном издании, прежде чем попасть на arXiv.

Подписывая статью, автор берёт полную ответственность за её содержание — независимо от того, как оно было создано. Если в работе окажется плагиат, ошибки, ложные ссылки или вводящая в заблуждение информация, виноваты авторы. Если доказано, что они не проверяли результаты LLM — нам нельзя доверять ни одной их работе.

Как применяются правила

Баны будут вводиться только при недвусмысленных доказательствах халатности. Сначала модератор фиксирует нарушение, затем глава секции подтверждает решение.

Авторы могут обжаловать блокировку. При этом arXiv подчёркивает: речь идёт не о запрете на использование ИИ, а о недопустимости публикации непроверенного контента.

Предыстория ужесточения

Ещё в прошлом году arXiv обновил политику: теперь обзорные статьи и позиционные документы в области computer science принимаются только после прохождения рецензирования на конференции или в журнале.

Повод был прост: с появлением больших языковых моделей стало слишком легко генерировать статьи, похожие на научные, но по сути являющиеся «аннотированными списками литературы» без глубокого анализа.

Как тогда заявили в arXiv: «Большинство присылаемых обзоров — это не более чем библиографии с комментариями, без обсуждения открытых научных вопросов».

Читать оригинал