ChatGPT Images 2.0: что умеет новый генератор OpenAI
OpenAI показала ChatGPT Images 2.0 — генератор картинок, который «думает» перед рисованием, аккуратно пишет текст на русском и собирает сложные журнальные композиции.
TL;DR: 21 апреля 2026 OpenAI выпустила ChatGPT Images 2.0 — новое поколение генератора картинок в ChatGPT. Главное отличие от предыдущей версии: модель теперь рассуждает над промптом, аккуратнее рисует текст на разных языках и вытягивает сложные композиции вроде журнальных разворотов и инфографики. Работает внутри ChatGPT, доступна всем платным тарифам.
ChatGPT Images 2.0 — это генератор картинок внутри ChatGPT с thinking mode, рендерингом текста на 20+ языках (включая русский) и поддержкой сложных многопанельных композиций. Модель доступна с 21 апреля 2026 на платных тарифах Plus, Pro, Business и Enterprise. API-версии пока нет.
Image-модели в ChatGPT не обновлялись больше года. OpenAI тихо отставала: Google запустил Nano Banana ещё в конце 2025, Midjourney довёл реалистичность до фотошопа, Flux и Ideogram закрепились как стандарт для графики с текстом. И вот на сцене новая модель, которую OpenAI назвала не DALL·E 4, а просто ChatGPT Images 2.0 — видимо, бренд DALL·E решили окончательно убрать.
Разбираю, что внутри, чем она отличается от предыдущей версии и стоит ли вообще её рассматривать, если ты уже сидишь в Midjourney или Gemini.

Что такое ChatGPT Images 2.0
Это генеративная модель картинок, встроенная в ChatGPT. Пишешь промпт — получаешь картинку. На поверхности всё как раньше. Под капотом — другая архитектура, которая, по словам OpenAI, умеет «рассуждать» перед тем как рисовать. Модель тратит больше времени на планирование композиции, проверку текста и согласование деталей, прежде чем выдать финальный результат.
По механике это похоже на reasoning в GPT-5.3: вместо цепочки текстовых шагов модель прогоняет внутренние черновики композиции и отбраковывает неудачные варианты. На одну картинку уходит больше секунд, но результат попадает в промпт точнее.
Запуск привязан к двум вещам. Первое: OpenAI явно догоняет Google и её Nano Banana, которая весь 2025 год была эталоном по рендерингу текста и соответствию промпту. Второе: ChatGPT становится универсальной оболочкой для всего. Голос, картинки, видео (Sora), код (Codex), агенты (Operator) — всё в одном окне.
В чём главные улучшения
OpenAI выделяет шесть направлений, по которым новая модель сильнее предыдущей. Пройдусь по каждому и дам свой комментарий.
Точнее следует промпту
Модель лучше держит детали. Если в промпте указано «три кубика, два синих и один красный, с цифрами 1, 2, 3 на верхних гранях» — раньше это превращалось в три случайных кубика с неправильными цифрами или вообще без текста. Теперь, судя по примерам OpenAI, результат стабильно попадает в запрос.
Это не революция, а догоняющее улучшение. Gemini 3 Pro Image и Flux уже год как держат промпты на таком уровне. Но для тех, кто живёт в ChatGPT и не хочет прыгать между сервисами, это важно.
Сильнее в разных языках
Главная фишка релиза. По данным анонса OpenAI, модель поддерживает более 20 языков в рендеринге текста — китайский, японский, корейский, хинди, арабский, тайский, русский, греческий, бенгальский, деванагари и другие. Раньше это было откровенной болью: иероглифы превращались в кашу, кириллица искажалась, арабская вязь ломалась в неправильную сторону.

Для русскоязычной аудитории это конкретный шаг вперёд. Наконец можно делать постеры, обложки, инфографику с русским текстом и не получать «Прɪвeт миp» вместо «Привет мир». По моему опыту с DALL·E 3, кириллица была фактически нерабочей — приходилось либо писать латиницей, либо дорисовывать текст в Figma. Судя по анонсу, эта проблема закрыта.
Больше стилей и реализма
Модель обещает одинаково хорошо работать в фото, аниме, манге, пиксель-арте, ретро-комиксах, 35мм плёночной фотографии и десятке других стилей. Раньше ChatGPT заметно валился на всё, что сложнее «цифровой иллюстрации» и «фотореализма». Аниме был карикатурным, манга — пережаренной, пиксель-арт не держал сетку.

Интересно посмотреть, как это сравнится с Midjourney v8 и Flux Pro. На примерах OpenAI всё выглядит убедительно, но презентационные картинки всегда выглядят убедительно. Реальную оценку можно дать только после тестов на своих промптах. В ближайшие дни прогоню одни и те же промпты через Images 2.0, Midjourney v8 и Flux Pro — напишу отдельный пост с визуальным сравнением.
Актуальные данные и контекст
Новая модель подтянута к актуальным знаниям — может рисовать картинки по свежим новостям, брендам, мемам, дизайн-трендам. Один из примеров, показанных в анонсе OpenAI от 21 апреля 2026: инфографика по design trends 2025 с актуальными направлениями вроде Shape-Driven Layouts и Motion-First Design. Модель собрала их сама, без ручной раздачи названий трендов.
Это важнее, чем кажется. Генераторы картинок традиционно застревают в данных своего обучения: просишь нарисовать «логотип в стиле 2024 года» — получаешь 2021-й. Если Images 2.0 действительно умеет подтягивать свежий контекст (через тот же thinking mode, что в GPT-5.3), это открывает сценарии вроде автоматизации социальных обложек под актуальные инфоповоды.
Мыслящий визуальный партнёр
Самая громкая заявка OpenAI. Модель позиционируется как «thinking partner»: обдумывает задачу, ищет данные, собирает их в композицию, а не рисует по промпту в лоб. В примере с математическим доказательством Кантора она построила целую инфографику с диагональным аргументом, со схемой, а не декоративной картинкой поверх формул.

Похожее поведение я видел у Claude Design (анализировал в отдельном обзоре) — там AI тоже пытается понять содержательную задачу, а не просто натянуть стиль. Подход правильный. Вопрос только в том, насколько стабильно модель вывозит такие сценарии за пределы вылизанных демок.
Сложные многопанельные композиции
Images 2.0 заявляет способность собирать журнальные развороты, комиксы, мокапы брендов, продуктовые линейки — то, где нужна согласованность между отдельными элементами. Это то, на чём ломались все предыдущие модели, включая DALL·E 3.

Если это работает хотя бы в половине случаев — это серьёзно. Сейчас такие композиции собирают либо руками в Figma, либо через связку из нескольких генераций и ручной правки. Автоматизация этого шага даёт черновик макета за минуты вместо часов ручной работы.
Практическое применение
Где это пригодится, если ты не дизайнер:
- Обложки для блога и соцсетей с текстом на русском
- Схемы и инфографика для презентаций
- Мокапы товаров и интерфейсов, где важна согласованность логотипа между генерациями (типичная боль Midjourney и Flux)
- Иллюстрации к статьям и постам
- Цветовой и стилистический анализ (один из примеров OpenAI — персонализированная палитра Deep Autumn)

По сути, ChatGPT становится местом, где можно закрыть визуальные задачи без ухода в отдельные инструменты. Не заменит Figma для серьёзной работы, но для быстрых задач вроде «сделай пост в Telegram с цитатой» — да.
Как это сравнить с конкурентами
Сравнение честно сделать сложно, пока не протестируешь руками на реальных промптах. Но по заявленным характеристикам картина такая:
| Модель | Сильные стороны | Где проигрывает |
|---|---|---|
| Midjourney v8 | Реализм, художественный вкус, фото-стили | Текст и сложные композиции, отдельный интерфейс |
| Google Nano Banana | Рендеринг текста, следование промпту | Только внутри Gemini |
| Flux Pro 1.2 | Типографика, открытая модель | Нужна сторонняя обёртка или API |
| ChatGPT Images 2.0 | Мультиязычный текст, интеграция с ChatGPT, thinking-режим | Догоняющий релиз, API пока нет |
Ключевое отличие OpenAI — контекст. Модель сидит внутри ChatGPT со всем его инструментарием: веб-поиск, агенты, память о твоих проектах, файлы. Для кого-то это перевесит любую разницу в технических характеристиках.
Цены и доступность
Модель уже раскатали. Доступна всем платным тарифам ChatGPT — Plus, Pro, Business, Enterprise. Бесплатные пользователи получат ограниченное количество генераций в день. В API пока недоступна, но OpenAI обещает вскоре.
Вывод
ChatGPT Images 2.0 — это догоняющий релиз, оформленный как революция. Главные заявленные улучшения (мультиязычный текст, сложные композиции, стили, реализм) закрывают дыры, которые у DALL·E 3 были болезненными. Но ничего принципиально нового, чего не умели бы Nano Banana, Midjourney или Flux, здесь нет.
Думаю, главная ценность модели — в интеграции. Если ты и так сидишь в ChatGPT ради поиска и агентов, получить внутри того же окна генератор картинок с русским текстом и thinking-режимом удобнее, чем открывать отдельный сервис. Для всех остальных Midjourney или Flux остаются более сильными специализированными инструментами.
Протестирую сам в ближайшие дни, сравню с Gemini 3 Pro Image и Midjourney v8, напишу отдельный пост с прямым сравнением на одинаковых промптах.
Частые вопросы
Чем ChatGPT Images 2.0 отличается от DALL·E 3?
Главное отличие — thinking mode: модель обдумывает промпт, проверяет текст и согласованность деталей перед генерацией. Images 2.0 сильно лучше рендерит текст на разных языках (включая русский), стабильнее держит сложные композиции вроде журнальных разворотов и инфографики. DALL·E 3 на таких задачах ломался или выдавал кашу вместо букв.
Как работает thinking mode в генерации картинок?
Модель не переходит сразу от промпта к изображению. Сначала она анализирует запрос, может пойти в веб-поиск за актуальными данными, планирует композицию и проверяет внутренние детали: текст, пропорции, согласованность элементов. На выходе получается изображение с обдуманной структурой, а не первое попавшееся визуальное совпадение.
Доступна ли ChatGPT Images 2.0 бесплатно?
Полный доступ только на платных тарифах ChatGPT: Plus, Pro, Business, Enterprise. Бесплатные пользователи получают ограниченное число генераций в день. API-доступа к Images 2.0 пока нет, OpenAI обещает выпустить позже. Если ты автоматизируешь генерацию картинок через API — пока остаётся предыдущая версия модели.
Что выбрать: ChatGPT Images 2.0 или Midjourney?
Midjourney остаётся сильнее в фото-стилях и художественном реализме. ChatGPT Images 2.0 выигрывает в мультиязычном тексте (включая русский), интеграции с чатом и thinking-режиме для сложных композиций. Выбирай Midjourney для арта и портретов, Images 2.0 — если работаешь внутри ChatGPT и нужны постеры, инфографика и мокапы.
Что ещё почитать
- Claude Design: как Anthropic делает дизайн через чат — похожий thinking-подход к визуальным задачам
- Gemma 4: открытые модели Google на технологиях Gemini 3 — то, чем отвечает Google на фронте моделей
- Claude Opus 4.7: обзор новой модели Anthropic — главный конкурент ChatGPT на уровне текстовых моделей
- Microsoft MAI: три модели для голоса, транскрипции и картинок — Microsoft тоже заходит на территорию мультимодальных AI
Источник: Introducing ChatGPT Images 2.0 — OpenAI, 21 апреля 2026.