ChatGPT Images 2.0 — всё, что нужно знать. Сравнение с Nano Banana 2 и Nano Banana Pro

Habr AI 22 апр 2026

OpenAI запустила ChatGPT Images 2.0 21 апреля 2026 года. В интерфейсе ChatGPT это новый встроенный генератор изображений, а в API модель называется gpt-image-2. Обычная генерация доступна на всех тарифах, включая бесплатный.

OpenAI делает акцент на улучшенном рендере текста, мультиязычности, точном следовании инструкциям, создании сложных макетов, редактировании и более надёжной работе с реальными объектами и сценами. В официальных примерах показаны постеры, инфографика, UI-мокапы, комиксы и многоязычные изображения.

Появился новый режим — Images with Thinking. В нём модель тратит больше времени на анализ запроса: может планировать композицию, уточнять задачу, использовать внутренние tools, reasoning и live-данные из веб-поиска. Это полезно для сложных визуальных задач, требующих предварительного анализа.

8 ключевых возможностей

Гибкие размеры до 4K (максимальная сторона — 3840 пикселей). Популярные форматы: 1024×1024, 2048×2048, 3840×2160, 2160×3840 — без апскейла.
Улучшенный рендеринг текста — читаемые надписи на постерах, меню, UI-мокапах, инфографике.
Thinking Mode (с reasoning и возможным веб-поиском) — модель может исследовать контекст, трансформировать данные, генерировать варианты и самопроверять результат.
Несколько изображений за запрос (параметр n, до 10 в API) — подходит для вариантов, сторибордов, мультиформатных кампаний.
Гибкие соотношения сторон — идеально для баннеров, сторис, постеров без кропа.
Многоязычный текст — поддержка кириллицы, японского, корейского, хинди, арабского, китайского в одном изображении.
Мультиреференсный ввод — возможность использовать несколько изображений на входе (точный лимит не объявлен).
Структурированная генерация — диаграммы, инфографика, комиксы, презентации.

Два режима работы

Обычная генерация — доступна для всех планов, включая Free. Быстрая генерация без дополнительного анализа.
Images with Thinking — доступно в Plus, Pro, Business (Enterprise и Edu — в ближайшее время). Включает reasoning, возможный веб-поиск и самопроверку.

Готовые шаблоны промптов

OpenAI рекомендует использовать чёткую структуру промпта. Важно писать запрос в логическом порядке: сцена/фон → субъект → детали → ограничения. Также полезно сразу указывать use case, например: реклама, UI-мокап, инфографика. Это эффективнее, чем использование бессмысленных эпитетов вроде masterpiece или insane details.

Универсальный шаблон

[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [ДЕЙСТВИЕ], [КОНТЕКСТ].

Scene: [где происходит, время суток, фон, окружение]

Subject: [кто или что в центре]

Important details: [материалы, одежда, текстура, освещение, угол камеры, настроение]

Use case: [editorial photo / product mockup / poster / UI screen / infographic]

Constraints: [no watermark / no logos / preserve face / preserve layout]

Шаблон для текстовых элементов

[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [КОНТЕКСТ]. Текстовые элементы в кавычках:

Заголовок: “ТОЧНЫЙ ТЕКСТ”
Подзаголовок: “ТОЧНЫЙ ТЕКСТ”
CTA: “ТОЧНЫЙ ТЕКСТ” [Стилевой якорь — художник/эпоха/медиум]. [Освещение + настроение]. [Камера/объектив + технические параметры].

5 правил, которые реально работают

Соотношение сторон указывайте первым: например, 16:9, 3:1 banner, 1:1 square.
Весь текст в промпте — в кавычках. Модель воспринимает его буквально.
Используйте конкретные стилевые якоря: например, Editorial fashion photograph, shot on Hasselblad, 90mm, f/2.8 вместо professional photo.
Освещение и настроение выделяйте отдельно: например, Rembrandt key light from upper-left, soft fill from right, warm tones.
Для мультиязычного текста явно указывайте язык: «Title in Japanese (Hiragana): 「春が来た」; subtitle in Korean: '봄이 왔다'».

Антипаттерны (что НЕ работает)

Избегайте: stunning, incredible, epic, masterpiece, gorgeous, insane detail.

Предпочитайте конкретику: overcast daylight, brushed aluminum, chipped paint, 50mm feel, soft bounce light.

Цены (API)

Стоимость зависит от типа запроса:

Cached Input — $1.25 / 1M токенов
Non-cached Input — $8.00 / 1M токенов
Cached Output — $2.00 / 1M токенов
Non-cached Output — $30.00 / 1M токенов
Reasoning (Thinking Mode) — $5.00 / 1M токенов
Web Search — $10.00 / 1M токенов

Для ориентира: генерация одного изображения 1024×1024 в режиме medium обходится примерно в $0.05–0.06.

Сравнение: GPT Image 2 vs Nano Banana 2 vs Nano Banana Pro

На данный момент GPT Image 2 менее строга в цензуре, чем Nano Banana 2 и Nano Banana Pro. В то время как последние часто отклоняют запросы с формулировкой «Изображение нарушает политику Google», GPT Image 2 выполняет те же задачи без фильтрации.

Однако такое послабление может быть временным: новые модели часто начинают с лояльного подхода, а затем постепенно ужесточают правила.

Сравнение по ключевым параметрам

Макс. разрешение

GPT Image 2 — до 4K (3840px)
Nano Banana 2 — 4K нативное
Nano Banana Pro — 4K нативное

Рендеринг текста

GPT Image 2 — значительно улучшен
Nano Banana 2 — средний
Nano Banana Pro — хороший

Reasoning / веб-поиск

GPT Image 2 — да (Thinking Mode)
Nano Banana 2 — да (image search grounding)
Nano Banana Pro — да (Gemini 3 Pro + Google Search)

Количество изображений за запрос

GPT Image 2 — до 10 (API)
Nano Banana 2 — до 4
Nano Banana Pro — до 4

Мультиреференсный ввод

GPT Image 2 — да (лимит не указан)
Nano Banana 2 — нет
Nano Banana Pro — да

Скорость (API, медиана)

Nano Banana 2 — высокая
Nano Banana Pro — средняя
GPT Image 2 — средняя

Доступность

GPT Image 2 — Free / Plus / Pro / API
Nano Banana 2 — Gemini Free / Pro
Nano Banana Pro — Google AI Pro ($19.99/мес)

Thinking Mode

GPT Image 2 — Plus, Pro, Business
Nano Banana 2 — через Gemini 3.1
Nano Banana Pro — через Gemini 3 Pro

Позиция в лидерборде (Image Arena, апрель 2026)

В рейтинге arena.ai GPT Image 2 (medium-версия) заняла первое место с большим отрывом.

Цена за 1000 изображений (API, ориентировочно)

Nano Banana (Gemini 2.5 Flash) — $30
Nano Banana 2 — $45
Nano Banana Pro — $60
GPT Image 2 (medium) — $50–60

Где каждая модель выигрывает

GPT Image 2 — если важна интеграция с ChatGPT и Codex, мультишаговое редактирование через Responses API и работа в экосистеме OpenAI.
Nano Banana 2 — лучшее соотношение цена/качество: качество близко к GPT Image 2 при цене в 2–3 раза ниже и скорости в 4 раза выше.
Nano Banana Pro — если вы уже используете Google AI Pro и нужна глубокая интеграция с Google-инструментами.

Читать оригинал

ChatGPT Images 2.0 — всё, что нужно знать. Сравнение с Nano Banana 2 и Nano Banana Pro

8 ключевых возможностей

Два режима работы

Готовые шаблоны промптов

Универсальный шаблон

Шаблон для текстовых элементов

5 правил, которые реально работают

Антипаттерны (что НЕ работает)

Цены (API)

Сравнение: GPT Image 2 vs Nano Banana 2 vs Nano Banana Pro

Сравнение по ключевым параметрам

Позиция в лидерборде (Image Arena, апрель 2026)

Цена за 1000 изображений (API, ориентировочно)

Где каждая модель выигрывает

ChatGPT Images 2.0 — все, что нужно знать прямо сейчас. Сравнение с Nano Banana 2 и Nano Banana Pro

8 Ключевых возможностей

Два режима работы

Готовые шаблоны промптов

Универсальный шаблон

Шаблон для текстовых элементов

5 правил, которые реально работают

Антипаттерны (что НЕ работает)

Цены (API)

Сравнение: GPT Image 2 vs Nano Banana 2 vs Nano Banana Pro

Сравнение по ключевым параметрам

Позиция в лидерборде (Image Arena, апрель 2026)

Цена за 1000 изображений (API, ориентировочно)

Скорость генерации (медиана, API)

Где каждая модель выигрывает