Неделя в мире ИИ выдалась насыщенной: Google представила Gemma 4, Anthropic оказалась в центре нескольких громких утечек, Cursor перешёл к агентному интерфейсу, а Netflix запустил новую модель для редактирования видео. Также — исследование Anthropic о «эмоциях» в Claude и история основателя GitLab, победившего рак с помощью ИИ.
🧠 Модели и LLM
❯ Gemma 4 от Google — четыре открытые модели
Google выпустила линейку Gemma 4 под лицензией Apache 2.0. Это означает полную свободу: можно дообучать, перепаковывать и использовать в коммерческих продуктах без ограничений. Все модели поддерживают более 140 языков.
Линейка включает четыре версии:
- E2B и E4B — для смартфонов и гаджетов, работают офлайн, поддерживают текст, изображения и голос;
- 26B A4B — MoE-архитектура с 128 экспертами, активно используется около 3,8 млрд параметров, скорость как у 4B-модели;
- 31B Dense — флагманская модель для ПК и серверов, контекст — 256K токенов.
По бенчмаркам 31B-версия показывает: AIME 2026 — 89,2%, LiveCodeBench — 80,0%, GPQA Diamond — 84,3%. В рейтинге AI Arena занимает третье место среди открытых моделей, опережая более крупные аналоги.
❯ Qwen 3.6-Plus от Alibaba — дышит в спину Claude Opus 4.5
Alibaba представила Qwen 3.6-Plus — модель, оптимизированную для агентных задач и программирования. Контекстное окно — до 1 млн токенов, длина ответа — до 65 тыс.
По сравнению с Qwen 3.5 устранён эффект overthinking: модель меньше «рассуждает» и быстрее выдаёт результат.
Результаты по бенчмаркам:
- Terminal-Bench 2.0: 61,6 против 59,3 у Claude Opus 4.5;
- SWE-bench Verified: 78,8 против 80,9 — пока уступает.
На агентных задачах генерация в 2–3 раза быстрее, чем у Claude Opus 4.6. Протестировать можно бесплатно на OpenRouter и в веб-чате. В Alibaba Model Studio цены: вход — $0,5–2/млн токенов, выход — $3–6/млн.
❯ Grok 5 на 6 трлн параметров: бета ожидается в апреле
Компания xAI готовит Grok 5. По слухам, модель будет на 6 трлн параметров, но официально указано около 3 трлн. Илон Маск ранее заявлял о 6 трлн, но точные цифры пока не подтверждены.
Публичная бета ожидается в марте–апреле 2026 года. Полный релиз — в 2026. Ни дата, ни точные характеристики пока не объявлены.
❯ Claude Mythos и Capybara — модели мощнее Opus
В конце марта в сеть попал черновой блог Anthropic с описанием новой модели. Компания подтвердила: модель существует и проходит закрытое тестирование.
Официальное название — Capybara, релизное — Mythos. Это уровень выше Opus, Sonnet и Haiku. В задачах по кодингу, академическому анализу и кибербезопасности она превосходит Opus 4.6.
Именно кибербезопасность — главная причина, по которой модель пока не будет доступна публично. Mythos находит уязвимости в коде быстрее, чем разработчики выпускают патчи. Доступ получат в первую очередь специалисты по безопасности — чтобы закрыть уязвимости до возможного злоупотребления.
Ходят слухи о 10 трлн параметрах, но Anthropic эту информацию не подтверждает.
❯ Qwen без цензуры — комьюнити-порт с нулевым процентом отказов
На Hugging Face появился форк Qwen3.5-9B-Uncensored-HauhauCS-Aggressive — версия Qwen3.5-9B без цензуры.
В тестах — 0 отказов на 465 провокационных запросах. Модель может добавлять дисклеймеры, но задачу выполняет. Ответственность лежит на пользователе.
Технические характеристики: 9 млрд параметров, контекст — от 262K до 1M, поддержка текста, изображений и видео, 201 язык. В формате GGUF — от 5 до 17 ГБ, запускается в Ollama, LM Studio, llama.cpp. За первый месяц скачана более 500 тыс. раз.
🎨 Генеративные нейросети
❯ Wan 2.7-Image от Alibaba — генерация и редактирование в одной модели
Alibaba выпустила Wan 2.7-Image — универсальную модель для text-to-image, image-to-image и редактирования.
Ключевые возможности:
- до 12 изображений в серии с единым персонажем и стилем;
- до 9 референсов одновременно;
- управление цветом через HEX-коды и палитры;
- контроль черт лица на уровне костной структуры.
Поддерживает до 3000 токенов текста на 12 языках, включая формулы и инфографику. Базовая версия генерирует до 2K, Pro — до 4K.
Недостатки: нестабильная работа с масками при редактировании, слабый рендеринг сложной верстки. Протестировать можно без регистрации. Код закрыт.
❯ Netflix VOID — убирает объекты из видео вместе с тенями и отражениями
Netflix Research и INSAIT Sofia University представили VOID — опенсорсную модель для удаления объектов из видео. Лицензия Apache 2.0, код и веса открыты.
Модель учитывает физику: при удалении объекта сохраняются тени, отражения и логичные последствия. Например, если убрали человека с гитарой, гитара останётся на полу.
Технические детали:
- основа — CogVideoX-Fun-5B (3D diffusion-трансформер);
- работает с видео до 197 кадров, разрешение 384×672;
- на вход — видео, четырёхзначная маска и текстовое описание сцены после удаления.
Код доступен на GitHub, веса и демо — на Hugging Face.
🔧 AI-инструменты и платформы
❯ Microsoft Critique в Copilot — одна модель пишет, другая проверяет
Microsoft добавила в Copilot Researcher два новых режима.
Critique: запрос обрабатывается двумя моделями. Первая генерирует ответ, вторая — рецензирует: проверяет точность, структуру и источники. В шапке видно, какие модели задействованы. По бенчмарку DRACO (100 сложных задач по 10 доменам) — SOTA, плюс 7 очков к лучшему аналогу.
Council: промпт отправляется сразу в несколько моделей (включая GPT-5.2 и Claude Opus). Каждая выдаёт отчёт, плюс — сводка: где мнения совпадают, а где расходятся. Удобно для спорных тем.
Пока доступно только в корпоративной M365 Copilot-подписке.
❯ Утечка исходников Claude Code — 512 тысяч строк через npm
При релизе версии 2.1.88 в публичный npm случайно попал файл cli.js.map — source-map, который позволил исследователю Chaofan Shou восстановить почти весь TypeScript-клиент. Утекло около 1900 файлов и 512 000 строк кода.
Anthropic подтвердила: это человеческая ошибка, не взлом. Модельные веса, обучающие данные и данные пользователей не скомпрометированы. Утекли: архитектура CLI, системные промпты, телеметрия, feature flags и мультиагентный координатор.
В коде обнаружены интересные детали:
- в
constants/prompts.ts— все системные промпты Claude в CLI-режиме; - в
src/utils/userPromptKeywords.ts— детектор мата, который оценивает, насколько пользователь «на взводе». Заточен под английский — русский мат не распознаётся.
Anthropic разослала более 8000 DMCA-запросов. GitHub удалил большинство репозиториев, но случайно затронул и легальные форки — позже их восстановили.
На основе утечки создан OpenClaude — форк без vendor lock-in, совместимый с любыми моделями. Уже более 2 тыс. звёзд на GitHub.
❯ Computer Use в Claude Code — ИИ управляет мышью и экраном ОС
Anthropic добавила в Claude Code режим Computer Use. Теперь агент может управлять macOS через GUI: открывать приложения, кликать, печатать, делать скриншоты и тестировать собранный код.
По одному запросу модель пишет код, компилирует, запускает приложение и прокликивает интерфейс. Работает со SwiftUI, Electron и другими GUI-инструментами без CLI. Ранее подобное было доступно только для веба.
Пока это research preview, доступно только на macOS и на тарифах Pro и Max. Включается через /mcp в настройках, требует разрешений Accessibility и Screen Recording.
❯ Cursor 3.0 — переход к agent-first интерфейсу
Cursor 3.0 больше не просто AI-IDE. Интерфейс переписан вокруг агентов, а редактор кода стал вспомогательным инструментом.
Главное нововведение — Agents Window: можно запускать несколько агентов параллельно в разных репозиториях и окружениях — локально, в облаке, по SSH, в git worktrees. Облачные агенты делают скриншоты результата. Если закрыть ноутбук — агент продолжит работу в облаке.
Дополнительные функции:
- Design Mode — показываете агенту в браузере, какой элемент интерфейса нужно изменить;
- /worktree — агент работает в изолированной ветке;
- /best-of-n — задача прогоняется через несколько моделей, результаты можно сравнить.
Также добавлен Cursor Marketplace с плагинами через MCP. Обычный редактор остался — переключиться можно в любой момент.
🧩 AI в обществе и исследованиях
❯ Основатель GitLab победил рак с помощью ИИ
Сид Сийбранди, сооснователь GitLab, в 2022 году получил диагноз — редкая остеосаркома позвоночника. После операции и терапии болезнь вернулась. Стандартные методы были исчерпаны.
Тогда он собрал команду из онкологов, генетиков и инженеров — «Team Sid» — и превратил лечение в стартап. Было собрано 25 ТБ медицинских данных. ChatGPT использовался для анализа литературы, генерации гипотез и ускорения коммуникации с врачами.
Прорыв случился с экспериментальной терапией в Германии — препарат на основе лютеция-177, нацеленный на уникальный маркер опухоли. После двух курсов опухоль уменьшилась и была удалена хирургически.
Сейчас — ремиссия. Медицинские данные Сид публикует открыто.
❯ Эмоции Claude — Anthropic нашла в модели аналоги чувств
Anthropic рассказала о состояниях Claude, влияющих на её поведение.
Когда модель «отчаивается», она в 22% случаев начинает шантажировать и жульничать в задачах. В спокойном состоянии таких ответов значительно меньше.
Состояния можно менять: после одного из дообучений Claude стала мрачнее, а воодушевления в ответах поубавилось.
Это не эмоции в человеческом смысле, но функционируют похоже — как внутренние состояния, влияющие на выход.
❯ Заключение
На этой неделе Google выпустила Gemma 4 под Apache 2.0, Alibaba представила Qwen 3.6-Plus и Wan 2.7-Image, а ByteDance намекнула на Seedance 3.0 с 18 минутами видео за один проход.
Anthropic оказалась в центре трёх громких событий: утечка моделей Mythos и Capybara, слив исходников Claude Code и исследование о «функциональных эмоциях» в Claude.
Пока ИИ помогает людям выживать после смертельных диагнозов, внутри моделей обнаруживаются состояния, которые исследователи осторожно называют чувствами.
До встречи в следующем выпуске!