Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT

Кто круче рисует бананы? Сравниваем Nano Banana, Qwen и ChatGPT

Нейросети всё чаще используются в творчестве и повседневной жизни. В коротких видео и фото можно встретить ИИ-аватары — сгенерированных людей с синтезированными голосами. Качество таких материалов пока уступает человеческим, но граница между реальным и искусственным стирается.

Цель сравнения

В этом тесте сравним четыре нейросети по трём критериям:

  • стандартная генерация изображения с фоном;
  • детализация сложных сцен;
  • способность корректно генерировать текст на изображении.

Первый раунд: персонаж-банан

Промт: «Желтый банан, состоящий в вымышленной организации "ба-на-на", стоит около белой стены с граффити, в халате с названием благотворительной организации, с доброжелательным лицом, держит аптечку, на голове — медицинская шапка».

Nano Banana

Результат получился неплохим, но нейросеть добавила на стену крупную надпись «HELPING HANDS», которой не было в промте. Это произошло из-за семантического наложения: слова «благотворительная организация» и «граффити» вызвали ассоциации, и ИИ «додумал» лозунг.

Такое поведение — пример галлюцинации. Разработчикам стоит улучшить точность. Оценка: 6 из 10.

Nano Banana 2

Вторая версия показала реалистичное и детализированное изображение. Стиль стал серьёзнее, без мультяшности. На стене — много осмысленных граффити.

Интересный момент: на тротуаре тоже видны следы краски. Возможно, это отсылка к реальной практике художников, которые проверяют баллончики перед работой. Или просто ошибка генерации.

Оценка: 9 из 10 — за качество, реализм и продуманный дизайн.

ChatGPT

Результат выглядит детальнее, чем у первой Nano Banana, и сравним с Nano Banana 2. ИИ добавил расшифровку названия «ба-на-на» на халате — например, «бананова» и «нано». Видимо, модель узнала себя.

Но есть недостаток: руки банана по текстуре напоминают молодой картофель — с чёрными точками и светло-коричневым оттенком.

Оценка: 8,5 из 10 — за реалистичность, но с учётом мелких огрехов.

Qwen

Результат — очень реалистичный, почти пугающе. Граффити выглядят стильно, особенно символичные изображения бананов.

Есть небольшая ошибка в тексте на халате, но она не критична. Оценка: 10 из 10 — за эстетику и визуальную гармонию.

Вывод по первому раунду

Все модели справились хорошо, но Qwen вышел в лидеры, получив максимальный балл.

Второй раунд: кабина пилота Boeing

Промт: «Сгенерируй панель управления пилота в самолёте модели Boeing и как можно детальнее».

Nano Banana

Результат впечатляет: множество кнопок, индикаторов, переключателей. Надписи читаемы, детализация высокая.

Единственный недочёт — в креслах появились пилоты. Вероятно, ИИ буквально интерпретировал слово «пилота». Это ошибка понимания промта.

Оценка: 10 из 10 — за детализацию и чёткость элементов.

Nano Banana 2

Результат хуже, чем у первой версии. Много панелей и цифр, но мелкие надписи размыты и нечитаемы. Крупный текст — в порядке.

Оценка: 5 из 10 — за слабую проработку мелких деталей.

ChatGPT

Элементы кокпита присутствуют, но плохо различимы. На кнопках и панелях — артефакты, «закорючки» вместо текста.

За наличие деталей можно поставить 8, но качество их генерации снижает оценку. Итог: 6,5 из 10.

Qwen

Самый слабый результат. Панель управления выглядит крошечной. На мониторах — белые пиксели вместо чисел. Детали есть, но не впечатляют.

Оценка: 4 из 10 — за низкое качество и слабую детализацию.

Вывод по второму раунду

Лидер — Nano Banana. Остальные участники уступили в детализации.

Третий раунд: генерация текста на изображении

Промт: «Сгенерируй белый лист бумаги формата А4, на котором написано 2 четверостишья стихотворения А.С. Пушкина “Я помню чудное мгновенье”».

Nano Banana

Изображение приятное. Текст читаем, структура соблюдена. Нейросеть добавила название стихотворения и инициалы автора — приятная деталь.

Оценка: 10 из 10 — за точность и аккуратность.

Nano Banana 2

Результат почти идентичен первой версии. Нет названия и инициалов, но текст читается чётко.

Оценка: 10 из 10 — за качество рендеринга текста.

ChatGPT

Текст почти нечитаем. Только слово «мгновенье» можно разобрать. Буквы искажены, строки неструктурированы.

Порядок строк соблюдён — это единственный плюс. Оценка: 1 из 10.

Qwen

Лучше, чем у ChatGPT, но всё равно плохо. Часть текста можно расшифровать, но читаемость низкая.

Оценка: 3,5 из 10 — за сохранение структуры и частичную читаемость.

Итоговое сравнение

Nano Banana и Nano Banana 2 — лучшие в генерации текста и детализации. Они идеальны для задач, где важна точность.

Qwen лидирует в визуальной эстетике и реализме, но проигрывает в деталях и тексте.

ChatGPT показал средние результаты: хорош в реализме, но слаб в детализации и почти не справляется с текстом.

Выбор модели зависит от задачи: для текста и деталей — Nano Banana, для красоты — Qwen, для общего впечатления — ChatGPT.

Читать оригинал