ChatGPT

ChatGPT Images 2.0: что умеет новый генератор OpenAI

OpenAI показала ChatGPT Images 2.0 — генератор картинок, который «думает» перед рисованием, аккуратно пишет текст на русском и собирает сложные журнальные композиции.

Pavel Matveev

22 апр. 2026 — 7 min read

TL;DR: 21 апреля 2026 OpenAI выпустила ChatGPT Images 2.0 — новое поколение генератора картинок в ChatGPT. Главное отличие от предыдущей версии: модель теперь рассуждает над промптом, аккуратнее рисует текст на разных языках и вытягивает сложные композиции вроде журнальных разворотов и инфографики. Работает внутри ChatGPT, доступна всем платным тарифам.

ChatGPT Images 2.0 — это генератор картинок внутри ChatGPT с thinking mode, рендерингом текста на 20+ языках (включая русский) и поддержкой сложных многопанельных композиций. Модель доступна с 21 апреля 2026 на платных тарифах Plus, Pro, Business и Enterprise. API-версии пока нет.

Image-модели в ChatGPT не обновлялись больше года. OpenAI тихо отставала: Google запустил Nano Banana ещё в конце 2025, Midjourney довёл реалистичность до фотошопа, Flux и Ideogram закрепились как стандарт для графики с текстом. И вот на сцене новая модель, которую OpenAI назвала не DALL·E 4, а просто ChatGPT Images 2.0 — видимо, бренд DALL·E решили окончательно убрать.

Разбираю, что внутри, чем она отличается от предыдущей версии и стоит ли вообще её рассматривать, если ты уже сидишь в Midjourney или Gemini.

Что такое ChatGPT Images 2.0

Это генеративная модель картинок, встроенная в ChatGPT. Пишешь промпт — получаешь картинку. На поверхности всё как раньше. Под капотом — другая архитектура, которая, по словам OpenAI, умеет «рассуждать» перед тем как рисовать. Модель тратит больше времени на планирование композиции, проверку текста и согласование деталей, прежде чем выдать финальный результат.

По механике это похоже на reasoning в GPT-5.3: вместо цепочки текстовых шагов модель прогоняет внутренние черновики композиции и отбраковывает неудачные варианты. На одну картинку уходит больше секунд, но результат попадает в промпт точнее.

Запуск привязан к двум вещам. Первое: OpenAI явно догоняет Google и её Nano Banana, которая весь 2025 год была эталоном по рендерингу текста и соответствию промпту. Второе: ChatGPT становится универсальной оболочкой для всего. Голос, картинки, видео (Sora), код (Codex), агенты (Operator) — всё в одном окне.

В чём главные улучшения

OpenAI выделяет шесть направлений, по которым новая модель сильнее предыдущей. Пройдусь по каждому и дам свой комментарий.

Точнее следует промпту

Модель лучше держит детали. Если в промпте указано «три кубика, два синих и один красный, с цифрами 1, 2, 3 на верхних гранях» — раньше это превращалось в три случайных кубика с неправильными цифрами или вообще без текста. Теперь, судя по примерам OpenAI, результат стабильно попадает в запрос.

Это не революция, а догоняющее улучшение. Gemini 3 Pro Image и Flux уже год как держат промпты на таком уровне. Но для тех, кто живёт в ChatGPT и не хочет прыгать между сервисами, это важно.

Сильнее в разных языках

Главная фишка релиза. По данным анонса OpenAI, модель поддерживает более 20 языков в рендеринге текста — китайский, японский, корейский, хинди, арабский, тайский, русский, греческий, бенгальский, деванагари и другие. Раньше это было откровенной болью: иероглифы превращались в кашу, кириллица искажалась, арабская вязь ломалась в неправильную сторону.

Многоязычный рендеринг текста в ChatGPT Images 2.0

Для русскоязычной аудитории это конкретный шаг вперёд. Наконец можно делать постеры, обложки, инфографику с русским текстом и не получать «Прɪвeт миp» вместо «Привет мир». По моему опыту с DALL·E 3, кириллица была фактически нерабочей — приходилось либо писать латиницей, либо дорисовывать текст в Figma. Судя по анонсу, эта проблема закрыта.

Больше стилей и реализма

Модель обещает одинаково хорошо работать в фото, аниме, манге, пиксель-арте, ретро-комиксах, 35мм плёночной фотографии и десятке других стилей. Раньше ChatGPT заметно валился на всё, что сложнее «цифровой иллюстрации» и «фотореализма». Аниме был карикатурным, манга — пережаренной, пиксель-арт не держал сетку.

Интересно посмотреть, как это сравнится с Midjourney v8 и Flux Pro. На примерах OpenAI всё выглядит убедительно, но презентационные картинки всегда выглядят убедительно. Реальную оценку можно дать только после тестов на своих промптах. В ближайшие дни прогоню одни и те же промпты через Images 2.0, Midjourney v8 и Flux Pro — напишу отдельный пост с визуальным сравнением.

Актуальные данные и контекст

Новая модель подтянута к актуальным знаниям — может рисовать картинки по свежим новостям, брендам, мемам, дизайн-трендам. Один из примеров, показанных в анонсе OpenAI от 21 апреля 2026: инфографика по design trends 2025 с актуальными направлениями вроде Shape-Driven Layouts и Motion-First Design. Модель собрала их сама, без ручной раздачи названий трендов.

💡

Это первая массовая модель, которая соединяет thinking mode с генерацией картинок. Модель может пойти в веб-поиск, собрать актуальные данные и сразу отрисовать их в визуал — без промежуточного текстового шага.

Это важнее, чем кажется. Генераторы картинок традиционно застревают в данных своего обучения: просишь нарисовать «логотип в стиле 2024 года» — получаешь 2021-й. Если Images 2.0 действительно умеет подтягивать свежий контекст (через тот же thinking mode, что в GPT-5.3), это открывает сценарии вроде автоматизации социальных обложек под актуальные инфоповоды.

Мыслящий визуальный партнёр

Самая громкая заявка OpenAI. Модель позиционируется как «thinking partner»: обдумывает задачу, ищет данные, собирает их в композицию, а не рисует по промпту в лоб. В примере с математическим доказательством Кантора она построила целую инфографику с диагональным аргументом, со схемой, а не декоративной картинкой поверх формул.

Похожее поведение я видел у Claude Design (анализировал в отдельном обзоре) — там AI тоже пытается понять содержательную задачу, а не просто натянуть стиль. Подход правильный. Вопрос только в том, насколько стабильно модель вывозит такие сценарии за пределы вылизанных демок.

Сложные многопанельные композиции

Images 2.0 заявляет способность собирать журнальные развороты, комиксы, мокапы брендов, продуктовые линейки — то, где нужна согласованность между отдельными элементами. Это то, на чём ломались все предыдущие модели, включая DALL·E 3.

Если это работает хотя бы в половине случаев — это серьёзно. Сейчас такие композиции собирают либо руками в Figma, либо через связку из нескольких генераций и ручной правки. Автоматизация этого шага даёт черновик макета за минуты вместо часов ручной работы.

Практическое применение

Где это пригодится, если ты не дизайнер:

Обложки для блога и соцсетей с текстом на русском
Схемы и инфографика для презентаций
Мокапы товаров и интерфейсов, где важна согласованность логотипа между генерациями (типичная боль Midjourney и Flux)
Иллюстрации к статьям и постам
Цветовой и стилистический анализ (один из примеров OpenAI — персонализированная палитра Deep Autumn)

По сути, ChatGPT становится местом, где можно закрыть визуальные задачи без ухода в отдельные инструменты. Не заменит Figma для серьёзной работы, но для быстрых задач вроде «сделай пост в Telegram с цитатой» — да.

Как это сравнить с конкурентами

Сравнение честно сделать сложно, пока не протестируешь руками на реальных промптах. Но по заявленным характеристикам картина такая:

Модель	Сильные стороны	Где проигрывает
Midjourney v8	Реализм, художественный вкус, фото-стили	Текст и сложные композиции, отдельный интерфейс
Google Nano Banana	Рендеринг текста, следование промпту	Только внутри Gemini
Flux Pro 1.2	Типографика, открытая модель	Нужна сторонняя обёртка или API
ChatGPT Images 2.0	Мультиязычный текст, интеграция с ChatGPT, thinking-режим	Догоняющий релиз, API пока нет

Ключевое отличие OpenAI — контекст. Модель сидит внутри ChatGPT со всем его инструментарием: веб-поиск, агенты, память о твоих проектах, файлы. Для кого-то это перевесит любую разницу в технических характеристиках.

Цены и доступность

Модель уже раскатали. Доступна всем платным тарифам ChatGPT — Plus, Pro, Business, Enterprise. Бесплатные пользователи получат ограниченное количество генераций в день. В API пока недоступна, но OpenAI обещает вскоре.

⚠️

Для разработчиков: API-доступа к Images 2.0 пока нет. Если ты автоматизируешь генерацию картинок через OpenAI API — придётся подождать или остаться на предыдущей версии.

Вывод

ChatGPT Images 2.0 — это догоняющий релиз, оформленный как революция. Главные заявленные улучшения (мультиязычный текст, сложные композиции, стили, реализм) закрывают дыры, которые у DALL·E 3 были болезненными. Но ничего принципиально нового, чего не умели бы Nano Banana, Midjourney или Flux, здесь нет.

Думаю, главная ценность модели — в интеграции. Если ты и так сидишь в ChatGPT ради поиска и агентов, получить внутри того же окна генератор картинок с русским текстом и thinking-режимом удобнее, чем открывать отдельный сервис. Для всех остальных Midjourney или Flux остаются более сильными специализированными инструментами.

Протестирую сам в ближайшие дни, сравню с Gemini 3 Pro Image и Midjourney v8, напишу отдельный пост с прямым сравнением на одинаковых промптах.

✈️

Разбираю такие AI-релизы по горячим следам и делюсь тестами — подписывайся в телеге.

Частые вопросы

Чем ChatGPT Images 2.0 отличается от DALL·E 3?

Главное отличие — thinking mode: модель обдумывает промпт, проверяет текст и согласованность деталей перед генерацией. Images 2.0 сильно лучше рендерит текст на разных языках (включая русский), стабильнее держит сложные композиции вроде журнальных разворотов и инфографики. DALL·E 3 на таких задачах ломался или выдавал кашу вместо букв.

Как работает thinking mode в генерации картинок?

Модель не переходит сразу от промпта к изображению. Сначала она анализирует запрос, может пойти в веб-поиск за актуальными данными, планирует композицию и проверяет внутренние детали: текст, пропорции, согласованность элементов. На выходе получается изображение с обдуманной структурой, а не первое попавшееся визуальное совпадение.

Доступна ли ChatGPT Images 2.0 бесплатно?

Полный доступ только на платных тарифах ChatGPT: Plus, Pro, Business, Enterprise. Бесплатные пользователи получают ограниченное число генераций в день. API-доступа к Images 2.0 пока нет, OpenAI обещает выпустить позже. Если ты автоматизируешь генерацию картинок через API — пока остаётся предыдущая версия модели.

Что выбрать: ChatGPT Images 2.0 или Midjourney?

Midjourney остаётся сильнее в фото-стилях и художественном реализме. ChatGPT Images 2.0 выигрывает в мультиязычном тексте (включая русский), интеграции с чатом и thinking-режиме для сложных композиций. Выбирай Midjourney для арта и портретов, Images 2.0 — если работаешь внутри ChatGPT и нужны постеры, инфографика и мокапы.

Что ещё почитать

Claude Design: как Anthropic делает дизайн через чат — похожий thinking-подход к визуальным задачам
Gemma 4: открытые модели Google на технологиях Gemini 3 — то, чем отвечает Google на фронте моделей
Claude Opus 4.7: обзор новой модели Anthropic — главный конкурент ChatGPT на уровне текстовых моделей
Microsoft MAI: три модели для голоса, транскрипции и картинок — Microsoft тоже заходит на территорию мультимодальных AI

Источник: Introducing ChatGPT Images 2.0 — OpenAI, 21 апреля 2026.