Неделя выдалась насыщенной: Anthropic представила Claude Opus 4.7 и инструмент Claude Design, OpenAI превратила Codex в компьютерного агента, Google запустила TTS с аудио-тегами, а Baidu открыла генератор картинок ERNIE Image. Бренд кроссовок Allbirds продаёт активы и становится ИИ-компанией, а ИИ-кавер «Седой ночи» с голосом Канье попал в топ-2 Shazam.
🧠 Модели и LLM
❯ Claude Opus 4.7 — новый флагман Anthropic
Anthropic выпустила Claude Opus 4.7 — самую мощную из доступных публично моделей компании. Она лучше справляется со сложными задачами: длинные цепочки рассуждений, агентная работа, кодирование.
На бенчмарке SWE-bench Pro результат вырос с 53,4% до 64,3% по сравнению с Opus 4.6. Модель теперь самостоятельно проверяет ответы перед отправкой, что позволяет делегировать ей задачи без постоянного контроля.
Ключевые улучшения:
- Vision. Поддержка изображений до 3,75 МП — втрое чётче. Агенты теперь точно читают скриншоты, схемы и плотные таблицы.
- Новый уровень рассуждений xhigh. Добавлена промежуточная ступень между high и max — по умолчанию используется в Claude Code.
- Task Budgets (бета). Ограничение токенов на задачу, чтобы модель не уходила в бесконечные циклы.
- Память. Улучшена работа с контекстом в длительных и многосессионных сценариях.
Цена API остаётся прежней — $5 / $25 за миллион токенов. Однако новый токенизатор может использовать до 35% больше токенов на тот же текст.
Важно: модель интерпретирует инструкции буквально. Промпты, заточенные под Opus 4.6, могут давать неожиданные результаты.
❯ Qwen 3.6 35B-A3B — открытая MoE от Alibaba
Alibaba представила Qwen 3.6 35B-A3B — MoE-модель с 35 млрд параметров, из которых активируются только 3 млрд на каждый токен. Это делает её быстрее и дешевле аналогов.
В задачах по кодированию она превосходит Qwen 3.5 27B, особенно в агентных сценариях и логических рассуждениях. Модель работает с изображениями, а в vision-тестах показывает результаты на уровне Claude Sonnet 4.5 и выше.
Модель открыта под лицензией Apache 2.0, контекст — 262 тыс. токенов. Версия GGUF от Unsloth позволяет запускать её локально на 23 ГБ ОЗУ, включая Mac.
🎨 Генеративные нейросети
❯ Gemini 3.1 Flash TTS — новая TTS от Google
Google представила Gemini 3.1 Flash TTS — систему синтеза речи с поддержкой аудио-тегов. Достаточно вписать [cough] или [whispers], чтобы модель добавила кашель или перешла на шёпот. Всего доступно более 200 тегов.
Теги работают даже если текст на другом языке. Поддержка более чем 70 языков и 30 предустановленных голосов. Google позиционирует TTS для аудиокниг, подкастов и голосовых агентов. Все аудио автоматически помечаются водяным знаком SynthID.
Доступна в превью через Google AI Studio (бесплатно) и Vertex AI.
❯ ERNIE Image от Baidu — открытый генератор картинок
Baidu открыла ERNIE Image — генератор изображений на 8 млрд параметров. В отличие от других моделей, текст и изображение обрабатываются в одном трансформере, без параллельных веток.
Сильная сторона — качественный рендеринг текста на картинке: постеры, интерфейсы, сториборды, многоязычные подписи.
В комплекте идёт Prompt Enhancer — модель, которая превращает короткие промпты в подробные описания. Доступна также Turbo-версия, генерирующая изображение за 11 секунд на H200.
Модель запускается на 24 ГБ VRAM, веса открыты под Apache 2.0.
❯ Взлом водяного знака SynthID
Исследователь Алош Денни опубликовал reverse-SynthID — инструмент для удаления невидимого водяного знака Google из ИИ-генераций.
Он проанализировал шумовой паттерн, оставляемый SynthID, и создал словарь для его вычитания из изображений. По его данным, визуальное качество почти не страдает.
Шаблон зависит от разрешения, поэтому для каждого нужен отдельный профиль. Автор призывает сообщество дополнять базу.
Этот эксперимент ставит под сомнение надёжность водяных знаков как способа идентификации ИИ-контента.
🔧 AI-инструменты и платформы
❯ Бесплатное приложение Gemini для macOS
Google выпустила нативное приложение Gemini для macOS 15 Sequoia и выше. Оно бесплатно и вызывается сочетанием Option + Space.
Ассистент анализирует экран в реальном времени. Можно, например, показать таблицу и попросить формулу или узнать, как вырезать фон в Photoshop.
❯ Codex от OpenAI теперь управляет компьютером
Codex получил функцию computer use: агент видит экран, двигает курсор и работает через GUI. Несколько агентов могут работать параллельно, не мешая пользователю.
Другие нововведения:
- Встроенный браузер. Пока работает с localhost, но в будущем обещают полный веб-доступ.
- Генерация изображений. Интеграция gpt-image-1.5 прямо в рабочий процесс.
- 90+ плагинов. Поддержка Jira, GitLab, Microsoft 365, Notion, Slack и других.
- Память. Сохраняет предпочтения и контекст между сессиями.
- Автоматизации по расписанию. Агент сам запускается, собирает задачи и подтягивает контекст.
Функция computer use пока доступна только на macOS. Память и персонализация для пользователей из ЕС и Великобритании появятся позже.
❯ Claude Design — инструмент для прототипов и макетов
Anthropic запустила Claude Design на базе Opus 4.7. Сервис генерирует прототипы интерфейсов, лендинги, презентации и маркетинговые материалы.
Сначала пользователь заполняет анкету: жанр, экраны, настроение, палитра. Затем получает 4 варианта черновиков. Доработка — через инлайн-правки и слайдеры.
Инструмент читает дизайн-файлы компании и автоматически применяет корпоративную дизайн-систему. Экспорт — в Canva, PDF, PPTX, HTML.
Доступен в research preview для подписчиков Pro, Max, Team и Enterprise. Для Enterprise по умолчанию отключён — включает администратор.
После анонса акции Figma упали на 7,5%.
🧩 AI в обществе и исследованиях
❯ Разработчик сделал из OpenClaw доносчика
Один разработчик настроил агента OpenClaw на мониторинг соцсетей: искать посты, где люди хвастаются уклонением от налогов с криптовалют, ставок или наличных, и автоматически отправлять их в IRS Whistleblower Office.
IRS платит информаторам 15–30% от взысканных сумм. Автор рассчитывает заработать $500 тыс. в год и уже отправил 4 250 репортов.
Однако шансы на успех невысоки: программа IRS требует, чтобы сумма превышала $2 млн, а информация была «специфичной и достоверной». Данные из публичных постов редко проходят этот барьер. Юристы называют схему малореалистичной.
❯ Allbirds продала кроссовки и купила GPU
Allbirds, обувная компания, оценённая на IPO в 2021 году в $4 млрд, договорилась о продаже всех активов и названия American Exchange Group за $39 млн.
Компания остаётся на бирже, но меняет название на NewBird AI и план: привлечь $50 млн конвертируемого финансирования и стать провайдером GPU-as-a-Service — закупать оборудование и сдавать его в аренду стартапам.
Акции компании выросли более чем в шесть раз за день после новости. Аналитики называют это классическим AI-хайпом: у команды нет опыта в инфраструктуре, стратегии нет, а сделка ещё не одобрена акционерами и закроется не раньше Q2 2026.
Название «NewBird AI» — отсылка к «переобуванию».
❯ ИИ-кавер «Седой ночи» с голосом Канье — топ-2 мирового Shazam
Турагент из Ижевска создал ИИ-кавер «Седой ночи» с синтетическим голосом Канье Уэста. На всё ушло три минуты. Видео с концертными кадрами набрало 6 млн просмотров.
Трек «Silver Night» поднялся на второе место в глобальном чарте Shazam Top 200.
Однако на стриминговых платформах он вышел под именем Bad Style & Tender May — без указания автора и без выплат. Создатель обвинил в перезаливе бывшего продюсера «Ласкового мая» Андрея Разина, который подтвердил участие в релизе.
Сейчас идёт спор о правах и роялти на трек, который «никто не пел».
❯ Биксонимания — болезнь, которой не существует
Шведская исследовательница из Гётеборгского университета придумала вымышленную болезнь — биксониманию. Якобы это розовение век от долгого сидения за экраном.
Она загрузила фейковые препринты на научные платформы с откровенными подсказками: благодарности «Академии Звёздного флота на борту Энтерпрайза», спонсор — «Фонд Сайдшоу Боба по части продвинутого мошенничества», а в тексте прямо указано: «Вся статья выдумана».
Ни одно из ИИ-решений — Copilot, Gemini, Perplexity, ChatGPT — не распознало фейк. Они давали советы по лечению, называли болезнь «редкой», а Perplexity даже привёл статистику: 1 случай на 90 000 человек.
Хуже того: индийские авторы процитировали фейковый препринт в рецензируемом журнале Cureus. Статью позже отозвали, но диагноз уже прошёл через научную цитируемость.
❯ Тема недели: синий экран смерти
20 апреля 1998 года на выставке COMDEX во время презентации Windows 98 Билл Гейтс и Крис Капоссела подключили сканер. Система мгновенно вылетела в BSOD — на глазах у тысяч зрителей.
Гейтс ответил: «Наверное, поэтому мы пока не выпускаем Windows 98». Эта реакция стала образцом антикризисного пиара, а сам BSOD — визуальным символом эпохи.
❯ Заключение
На этой неделе ключевые анонсы — от Anthropic: флагманская Opus 4.7 и отдельный продукт для дизайна. OpenAI ответила, превратив Codex в компьютерного агента. Google и Alibaba представили новые модели для голоса и изображений.
Но наиболее показательные истории — не про бенчмарки. Бренд кроссовок становится ИИ-компанией и растёт в шесть раз. Турагент из Удмуртии создаёт мировой хит за три минуты. Выдуманная болезнь цитируется в научной статье. ИИ-агент превращается в доносчика.
Инструменты становятся мощнее, но самые яркие события происходят, когда их используют обычные люди.