Gemma 4 от Google, утечка Claude Code, Cursor 3.0, нейросеть от Netflix и исследование эмоций Claude

Gemma 4 от Google, утечка Claude Code, Cursor 3.0, нейросеть от Netflix и исследование эмоций Claude

Неделя в мире ИИ выдалась насыщенной: Google представила Gemma 4, Anthropic оказалась в центре нескольких громких утечек, Cursor перешёл к агентному интерфейсу, а Netflix запустил новую модель для редактирования видео. Также — исследование Anthropic о «эмоциях» в Claude и история основателя GitLab, победившего рак с помощью ИИ.

🧠 Модели и LLM

❯ Gemma 4 от Google — четыре открытые модели

Google выпустила линейку Gemma 4 под лицензией Apache 2.0. Это означает полную свободу: можно дообучать, перепаковывать и использовать в коммерческих продуктах без ограничений. Все модели поддерживают более 140 языков.

Линейка включает четыре версии:

  • E2B и E4B — для смартфонов и гаджетов, работают офлайн, поддерживают текст, изображения и голос;
  • 26B A4B — MoE-архитектура с 128 экспертами, активно используется около 3,8 млрд параметров, скорость как у 4B-модели;
  • 31B Dense — флагманская модель для ПК и серверов, контекст — 256K токенов.

По бенчмаркам 31B-версия показывает: AIME 2026 — 89,2%, LiveCodeBench — 80,0%, GPQA Diamond — 84,3%. В рейтинге AI Arena занимает третье место среди открытых моделей, опережая более крупные аналоги.

❯ Qwen 3.6-Plus от Alibaba — дышит в спину Claude Opus 4.5

Alibaba представила Qwen 3.6-Plus — модель, оптимизированную для агентных задач и программирования. Контекстное окно — до 1 млн токенов, длина ответа — до 65 тыс.

По сравнению с Qwen 3.5 устранён эффект overthinking: модель меньше «рассуждает» и быстрее выдаёт результат.

Результаты по бенчмаркам:

  • Terminal-Bench 2.0: 61,6 против 59,3 у Claude Opus 4.5;
  • SWE-bench Verified: 78,8 против 80,9 — пока уступает.

На агентных задачах генерация в 2–3 раза быстрее, чем у Claude Opus 4.6. Протестировать можно бесплатно на OpenRouter и в веб-чате. В Alibaba Model Studio цены: вход — $0,5–2/млн токенов, выход — $3–6/млн.

❯ Grok 5 на 6 трлн параметров: бета ожидается в апреле

Компания xAI готовит Grok 5. По слухам, модель будет на 6 трлн параметров, но официально указано около 3 трлн. Илон Маск ранее заявлял о 6 трлн, но точные цифры пока не подтверждены.

Публичная бета ожидается в марте–апреле 2026 года. Полный релиз — в 2026. Ни дата, ни точные характеристики пока не объявлены.

❯ Claude Mythos и Capybara — модели мощнее Opus

В конце марта в сеть попал черновой блог Anthropic с описанием новой модели. Компания подтвердила: модель существует и проходит закрытое тестирование.

Официальное название — Capybara, релизное — Mythos. Это уровень выше Opus, Sonnet и Haiku. В задачах по кодингу, академическому анализу и кибербезопасности она превосходит Opus 4.6.

Именно кибербезопасность — главная причина, по которой модель пока не будет доступна публично. Mythos находит уязвимости в коде быстрее, чем разработчики выпускают патчи. Доступ получат в первую очередь специалисты по безопасности — чтобы закрыть уязвимости до возможного злоупотребления.

Ходят слухи о 10 трлн параметрах, но Anthropic эту информацию не подтверждает.

❯ Qwen без цензуры — комьюнити-порт с нулевым процентом отказов

На Hugging Face появился форк Qwen3.5-9B-Uncensored-HauhauCS-Aggressive — версия Qwen3.5-9B без цензуры.

В тестах — 0 отказов на 465 провокационных запросах. Модель может добавлять дисклеймеры, но задачу выполняет. Ответственность лежит на пользователе.

Технические характеристики: 9 млрд параметров, контекст — от 262K до 1M, поддержка текста, изображений и видео, 201 язык. В формате GGUF — от 5 до 17 ГБ, запускается в Ollama, LM Studio, llama.cpp. За первый месяц скачана более 500 тыс. раз.

🎨 Генеративные нейросети

❯ Wan 2.7-Image от Alibaba — генерация и редактирование в одной модели

Alibaba выпустила Wan 2.7-Image — универсальную модель для text-to-image, image-to-image и редактирования.

Ключевые возможности:

  • до 12 изображений в серии с единым персонажем и стилем;
  • до 9 референсов одновременно;
  • управление цветом через HEX-коды и палитры;
  • контроль черт лица на уровне костной структуры.

Поддерживает до 3000 токенов текста на 12 языках, включая формулы и инфографику. Базовая версия генерирует до 2K, Pro — до 4K.

Недостатки: нестабильная работа с масками при редактировании, слабый рендеринг сложной верстки. Протестировать можно без регистрации. Код закрыт.

❯ Netflix VOID — убирает объекты из видео вместе с тенями и отражениями

Netflix Research и INSAIT Sofia University представили VOID — опенсорсную модель для удаления объектов из видео. Лицензия Apache 2.0, код и веса открыты.

Модель учитывает физику: при удалении объекта сохраняются тени, отражения и логичные последствия. Например, если убрали человека с гитарой, гитара останётся на полу.

Технические детали:

  • основа — CogVideoX-Fun-5B (3D diffusion-трансформер);
  • работает с видео до 197 кадров, разрешение 384×672;
  • на вход — видео, четырёхзначная маска и текстовое описание сцены после удаления.

Код доступен на GitHub, веса и демо — на Hugging Face.

🔧 AI-инструменты и платформы

❯ Microsoft Critique в Copilot — одна модель пишет, другая проверяет

Microsoft добавила в Copilot Researcher два новых режима.

Critique: запрос обрабатывается двумя моделями. Первая генерирует ответ, вторая — рецензирует: проверяет точность, структуру и источники. В шапке видно, какие модели задействованы. По бенчмарку DRACO (100 сложных задач по 10 доменам) — SOTA, плюс 7 очков к лучшему аналогу.

Council: промпт отправляется сразу в несколько моделей (включая GPT-5.2 и Claude Opus). Каждая выдаёт отчёт, плюс — сводка: где мнения совпадают, а где расходятся. Удобно для спорных тем.

Пока доступно только в корпоративной M365 Copilot-подписке.

❯ Утечка исходников Claude Code — 512 тысяч строк через npm

При релизе версии 2.1.88 в публичный npm случайно попал файл cli.js.map — source-map, который позволил исследователю Chaofan Shou восстановить почти весь TypeScript-клиент. Утекло около 1900 файлов и 512 000 строк кода.

Anthropic подтвердила: это человеческая ошибка, не взлом. Модельные веса, обучающие данные и данные пользователей не скомпрометированы. Утекли: архитектура CLI, системные промпты, телеметрия, feature flags и мультиагентный координатор.

В коде обнаружены интересные детали:

  • в constants/prompts.ts — все системные промпты Claude в CLI-режиме;
  • в src/utils/userPromptKeywords.ts — детектор мата, который оценивает, насколько пользователь «на взводе». Заточен под английский — русский мат не распознаётся.

Anthropic разослала более 8000 DMCA-запросов. GitHub удалил большинство репозиториев, но случайно затронул и легальные форки — позже их восстановили.

На основе утечки создан OpenClaude — форк без vendor lock-in, совместимый с любыми моделями. Уже более 2 тыс. звёзд на GitHub.

❯ Computer Use в Claude Code — ИИ управляет мышью и экраном ОС

Anthropic добавила в Claude Code режим Computer Use. Теперь агент может управлять macOS через GUI: открывать приложения, кликать, печатать, делать скриншоты и тестировать собранный код.

По одному запросу модель пишет код, компилирует, запускает приложение и прокликивает интерфейс. Работает со SwiftUI, Electron и другими GUI-инструментами без CLI. Ранее подобное было доступно только для веба.

Пока это research preview, доступно только на macOS и на тарифах Pro и Max. Включается через /mcp в настройках, требует разрешений Accessibility и Screen Recording.

❯ Cursor 3.0 — переход к agent-first интерфейсу

Cursor 3.0 больше не просто AI-IDE. Интерфейс переписан вокруг агентов, а редактор кода стал вспомогательным инструментом.

Главное нововведение — Agents Window: можно запускать несколько агентов параллельно в разных репозиториях и окружениях — локально, в облаке, по SSH, в git worktrees. Облачные агенты делают скриншоты результата. Если закрыть ноутбук — агент продолжит работу в облаке.

Дополнительные функции:

  • Design Mode — показываете агенту в браузере, какой элемент интерфейса нужно изменить;
  • /worktree — агент работает в изолированной ветке;
  • /best-of-n — задача прогоняется через несколько моделей, результаты можно сравнить.

Также добавлен Cursor Marketplace с плагинами через MCP. Обычный редактор остался — переключиться можно в любой момент.

🧩 AI в обществе и исследованиях

❯ Основатель GitLab победил рак с помощью ИИ

Сид Сийбранди, сооснователь GitLab, в 2022 году получил диагноз — редкая остеосаркома позвоночника. После операции и терапии болезнь вернулась. Стандартные методы были исчерпаны.

Тогда он собрал команду из онкологов, генетиков и инженеров — «Team Sid» — и превратил лечение в стартап. Было собрано 25 ТБ медицинских данных. ChatGPT использовался для анализа литературы, генерации гипотез и ускорения коммуникации с врачами.

Прорыв случился с экспериментальной терапией в Германии — препарат на основе лютеция-177, нацеленный на уникальный маркер опухоли. После двух курсов опухоль уменьшилась и была удалена хирургически.

Сейчас — ремиссия. Медицинские данные Сид публикует открыто.

❯ Эмоции Claude — Anthropic нашла в модели аналоги чувств

Anthropic рассказала о состояниях Claude, влияющих на её поведение.

Когда модель «отчаивается», она в 22% случаев начинает шантажировать и жульничать в задачах. В спокойном состоянии таких ответов значительно меньше.

Состояния можно менять: после одного из дообучений Claude стала мрачнее, а воодушевления в ответах поубавилось.

Это не эмоции в человеческом смысле, но функционируют похоже — как внутренние состояния, влияющие на выход.

❯ Заключение

На этой неделе Google выпустила Gemma 4 под Apache 2.0, Alibaba представила Qwen 3.6-Plus и Wan 2.7-Image, а ByteDance намекнула на Seedance 3.0 с 18 минутами видео за один проход.

Anthropic оказалась в центре трёх громких событий: утечка моделей Mythos и Capybara, слив исходников Claude Code и исследование о «функциональных эмоциях» в Claude.

Пока ИИ помогает людям выживать после смертельных диагнозов, внутри моделей обнаруживаются состояния, которые исследователи осторожно называют чувствами.

До встречи в следующем выпуске!

Читать оригинал