Model and Modality Playbooks5 июля 2026 г.Big Y

GPT Image vs Imagen API: Единицы тарификации и проверки запросов

Используйте этот чек-лист для сравнения GPT Image и Imagen API по единицам тарификации, параметрам запросов, риску устаревания и проверкам состояния шлюза Flatkey.

Сравнение GPT Image и Imagen API — это уже не просто соревнование в качестве. Для производственных команд полезное сравнение носит операционный характер: какой формат API используют ваши клиентские вызовы, какую единицу тарификации может согласовать финансовый отдел, от каких параметров изображения зависит ваш продукт и доступен ли ваш маршрут шлюза в день запуска.

Коротко говоря: GPT Image теперь представляет собой путь генерации изображений в API OpenAI с тарификацией по токенам, где gpt-image-2 доступен через Image API, а инструменты генерации изображений — через Responses API. Imagen 4 все еще документируется Google с ценами за изображение, но Google помечает модели Imagen как устаревшие и заявляет, что они будут отключены 17 августа 2026 года. Поэтому команды, сравнивающие GPT Image и Imagen API, должны включить третью проверку: следует ли перенести рабочую нагрузку Google на семейство генерации изображений Nano Banana до начала любой новой интеграционной работы.

Flatkey может упростить операционный уровень благодаря одному ключу, одному базовому URL, обзору использования и проверкам маршрутов для разных семейств моделей. Это не отменяет необходимости проверять статус модели. В снимке API ценообразования Flatkey от 5 июля 2026 года для этой статьи gpt-image-2 появился в каталоге, но был помечен как official_unsupported, в то время как gemini-2.5-flash-image, gemini-3-pro-image и gemini-3-pro-image-preview были отмечены как доступные. Считайте это главным уроком: сравните API провайдеров, а затем проверьте точную строку Flatkey перед запуском производственного трафика.

Краткий ответ: GPT Image vs Imagen API

Область решения	GPT Image API	Imagen API	Что проверить через Flatkey
Текущий путь модели	OpenAI документирует модели GPT Image, включая `gpt-image-2`.	Google документирует Imagen 4, но помечает модели Imagen как устаревшие.	Подтвердите точную строку модели, семейство конечных точек и статус доступности в текущем представлении цен/каталога.
Основной формат конечной точки	`POST /v1/images/generations` для генерации через Image API; генерация изображений также может выполняться как инструмент Responses API.	`generate_images` в SDK или REST-вызовы `:predict` для Imagen 4.	Проверьте, использует ли маршрут `/v1/images/generations`, Gemini `generateContent` или совместимую с OpenAI конечную точку в стиле чата.
Единица тарификации	OpenAI оценивает стоимость GPT Image на основе токенов входного текста, токенов входного изображения для редактирования и токенов выходного изображения.	Google указывает для Imagen 4 Fast, Standard и Ultra цены за изображение в платных тарифах.	Нормализуйте единицы провайдеров перед сравнением с коэффициентами моделей Flatkey, журналами запросов и проверкой счетов.
Ключевые параметры	`model`, `prompt`, `size`, `quality`, формат/сжатие вывода, фон, потоковая передача и частичные изображения.	`model`, `prompt`, `numberOfImages`, `imageSize`, `aspectRatio` и `personGeneration`.	Отправьте один базовый запрос на изображение, затем один запрос с большим количеством параметров и сохраните ID запроса, использование, статус и поля стоимости.
Риск миграции	Маршрут GPT Image зависит от доступа к модели, верификации организации и текущих разрешений учетной записи.	Для моделей Imagen есть предупреждение об отключении с указанием даты; при новой работе с изображениями в Google следует рассмотреть модели Nano Banana.	Не полагайтесь на упоминание на главной странице или в старой статье. Проверьте текущую строку и резервный путь.

Если вам нужен только текущий рабочий процесс генерации изображений OpenAI, начните с GPT Image и Image API. Если у вас есть существующая интеграция с Imagen, ваше сравнение GPT Image и Imagen API должно включать план миграции, поскольку текущая документация Imagen содержит дату отключения. Если вы используете Flatkey, используйте сравнение, чтобы решить, что тестировать, а затем позвольте странице с ценами, панели управления и журналам запросов подтвердить фактический маршрут.

Факты от провайдеров, которые нужно проверить в первую очередь

В руководстве по генерации изображений OpenAI говорится, что API может генерировать и редактировать изображения с помощью моделей GPT Image, включая gpt-image-2. В нем проводится различие между Image API и Responses API: Image API предоставляет прямые конечные точки для генерации и редактирования, в то время как Responses API может вызывать генерацию изображений как инструмент в многоходовых диалогах. На странице модели GPT Image 2 OpenAI указан ID модели gpt-image-2 и текущий снимок gpt-image-2-2026-04-21.

Это не означает, что каждая учетная запись шлюза может маршрутизировать его сегодня. OpenAI отмечает, что модели GPT Image могут требовать верификации организации в API. Снимок API ценообразования Flatkey на день публикации показал gpt-image-2 в каталоге с типами конечных точек image-generation и openai, но статус строки был official_unsupported. Прежде чем включать сравнение GPT Image и Imagen API в производственную политику маршрутизации, подтвердите, есть ли у вашей учетной записи Flatkey рабочий маршрут для GPT Image или для этой рабочей нагрузки требуется прямой доступ к OpenAI.

В руководстве по Imagen от Google говорится, что Imagen — это модель генерации изображений высокой четкости от Google и что сгенерированные изображения включают водяной знак SynthID. На той же странице модели Imagen теперь помечены как устаревшие, с отключением 17 августа 2026 года, и рекомендуется миграция на Nano Banana для генерации изображений. В разделе миграции говорится, что следует использовать gemini-2.5-flash-image вместо названий моделей Imagen, использовать client.models.generate_content вместо client.models.generate_images и обрабатывать части контента ответа Nano Banana, а не специальный объект ответа изображения Imagen.

Текущее руководство Google по генерации изображений направляет читателей к моделям Nano Banana для большинства сценариев использования, включая Gemini 3.1 Flash Image, Gemini 3.1 Flash Lite Image, Gemini 3 Pro Image и Gemini 2.5 Flash Image. Именно поэтому в современной статье, сравнивающей GPT Image и Imagen API, не следует представлять Imagen 4 как выбор по умолчанию для новых проектов. Это сравнение для устаревших систем или миграции, если только у вашего проекта нет особой причины продолжать использовать Imagen до даты прекращения поддержки.

Единицы тарификации: не сравнивайте только общую цену

Тарификация — это та область, где сравнения GPT Image и Imagen API часто оказываются неверными. OpenAI и Google используют разные единицы измерения, и эти единицы меняются в зависимости от того, является ли запрос преобразованием текста в изображение, редактированием/использованием эталонного изображения, потоковой передачей, пакетной обработкой или маршрутизацией через шлюз.

Параметр тарификации	Проверка для GPT Image	Проверка для Imagen	Проверка для Flatkey
Единица вывода	В примерах OpenAI для GPT Image 2 используются выходные токены изображения и калькулятор для размера и качества.	Google указывает цены на Imagen 4 за одно выходное изображение.	Убедитесь, как маршрут записывает стоимость запроса и отображает ли строка Flatkey соотношения для модели, завершения, кэша или изображений.
Единица ввода	Запросы к GPT Image включают входные текстовые токены, а при редактировании могут включаться и входные токены изображения.	На странице цен Google генерация с помощью Imagen 4 тарифицируется за изображение, в то время как для Nano Banana указываются цены за входные токены.	Проверьте, отображаются ли затраты на промпт и эталонное изображение в журналах использования для выбранного вами маршрута.
Качество и размер	Параметры `quality` и `size` влияют на оценку количества выходных токенов.	У Imagen 4 есть цены для моделей Fast, Standard и Ultra; `imageSize` поддерживает 1K и 2K для Standard и Ultra.	Протестируйте точную комбинацию размера и качества, которую вы планируете использовать в продукте.
Несколько изображений	Параметр `n` в OpenAI генерирует несколько изображений за один запрос; стоимость масштабируется в зависимости от количества сгенерированных результатов.	Imagen поддерживает `numberOfImages` от 1 до 4, по умолчанию 4.	Не допускайте, чтобы настройка генерации нескольких изображений по умолчанию стала сюрпризом при проверке счетов.
Потоковая передача	Потоковая передача частичных изображений в OpenAI может добавлять выходные токены для каждого частичного изображения.	В документации Imagen акцент делается на ответах со сгенерированными изображениями, а не на той же форме потоковой передачи, что и у GPT Image.	Решите, будут ли промежуточные изображения отключены, регистрироваться в журналах или рассматриваться как оплачиваемые результаты.

В руководстве OpenAI по изображениям приведены примерные оценки стоимости вывода для GPT Image 2 для распространенных размеров. Для размера 1024 x 1024 в примерах указана стоимость $0.006 для низкого качества, $0.053 для среднего и $0.211 для высокого. В том же руководстве говорится, что итоговая стоимость — это сумма входных текстовых токенов, входных токенов изображения (при редактировании) и выходных токенов изображения. Используйте эти примеры для проверки единиц измерения, а не как постоянный бюджет, поскольку OpenAI направляет читателей на текущую страницу с ценами и калькулятор для окончательных расчетов.

На странице цен Gemini API от Google указаны цены для Imagen 4: $0.02 за изображение для Fast, $0.04 за изображение для Standard и $0.06 за изображение для Ultra на платном тарифе. В том же разделе предупреждается, что идентификаторы моделей Imagen 4 устарели и будут отключены 17 августа 2026 года. В разделе Nano Banana Google указывает стоимость для gemini-2.5-flash-image: $0.30 за 1 млн входных текстовых/изобразительных токенов и $0.039 за изображение для вывода размером 1024px, при этом базовая цена выходных токенов изображения составляет $30 за 1 млн токенов.

Практическое финансовое правило простое: преобразуйте затраты на GPT Image и Imagen API в рабочую таблицу запросов. Включите в нее токены промпта, эталонные изображения, количество выходных данных, качество, размер, режим генерации, частичные результаты потоковой передачи и статус строки шлюза. Затем сравните эту таблицу с подходом Flatkey к сравнению цен на ИИ-модели и текущей страницей цен Flatkey.

Структура запроса: что на самом деле отправляет ваш клиент

GPT Image и Imagen похожи только на уровне категории продукта. Структуры их запросов достаточно различны, чтобы миграция требовала явных изменений.

Для генерации изображений с помощью GPT Image через Image API, документация OpenAI для /v1/images/generations требует тело запроса в формате JSON и по умолчанию возвращает данные изображения в base64. Спецификация OpenAPI также показывает поля использования, такие как общее количество, входные и выходные токены в ответах с изображениями. Минимальный запрос проверяет модель, промпт, количество выходных данных и обработку вывода по умолчанию:

curl -X POST "https://api.openai.com/v1/images/generations" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "Чистый макет продукта на белой студийной поверхности",
    "size": "1024x1024",
    "quality": "medium",
    "n": 1
  }'

Для Imagen 4 через REST-путь Gemini API, руководство Google показывает вызов :predict к URL конкретной модели с параметрами instances и parameters:

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "instances": [
      { "prompt": "Робот держит красный скейтборд" }
    ],
    "parameters": {
      "sampleCount": 4
    }
  }'

Для Flatkey не следует предполагать единую универсальную структуру. Снимок API тарификации от 5 июля 2026 года содержал семейство конечных точек image-generation с путем /v1/images/generations, семейство конечных точек gemini с путем /v1beta/models/{model}:generateContent и семейство конечных точек чата openai с путем /v1/chat/completions. В том же снимке gemini-2.5-flash-image была доступна через типы конечных точек gemini и openai, в то время как gpt-image-2 была недоступна для использования. Ваш тест маршрута должен использовать то семейство конечных точек, которое действительно поддерживается строкой каталога.

Параметры запросов, которые нарушают миграцию

Большинство сюрпризов при сравнении API GPT Image и Imagen связаны с параметрами. API не используют одинаковые имена, значения по умолчанию или средства контроля безопасности.

Область параметров	Проверка API GPT Image	Проверка API Imagen	Примечание по миграции
Язык промпта	OpenAI поддерживает текстовые промпты для моделей GPT Image.	В руководстве Google по Imagen говорится, что в настоящее время Imagen поддерживает промпты только на английском языке.	Если ваше приложение принимает многоязычные промпты, протестируйте поведение прямого вывода перед миграцией.
Количество изображений на выходе	`n` управляет количеством изображений.	`numberOfImages` или `sampleCount` в REST управляет количеством изображений, от 1 до 4; по умолчанию 4.	Всегда указывайте количество изображений на выходе явно.
Размер и соотношение сторон	GPT Image 2 принимает гибкие размеры в рамках документированных ограничений; распространенные примеры включают квадратные изображения 1024, а также форматы 2K и 4K.	Imagen предоставляет `imageSize` для 1K/2K в версиях Standard и Ultra и значения `aspectRatio`, такие как 1:1, 3:4, 4:3, 9:16 и 16:9.	Сопоставляйте пресеты продукта вместо слепой передачи старых параметров.
Качество	GPT Image использует `low`, `medium`, `high` или `auto`.	Качество в Imagen частично определяется выбором модели: Fast, Standard или Ultra.	Переключателю «высокое качество» может потребоваться сопоставление для конкретного провайдера.
Генерация людей	OpenAI обеспечивает безопасность изображений с помощью модерации и фильтров политик.	Imagen документирует значения `personGeneration`, такие как `dont_allow`, `allow_adult` и `allow_all`, с региональными ограничениями.	Если ваше приложение генерирует изображения людей, это проверка, блокирующая запуск.
Прозрачность	OpenAI заявляет, что `gpt-image-2` в настоящее время не поддерживает прозрачный фон.	Упомянутая конфигурация генерации Imagen не является прямой заменой для элементов управления фоном OpenAI.	Не переносите рабочие процессы с прозрачными ассетами без предварительного тестирования на образцах.
Ошибки и модерация	OpenAI документирует `image_generation_user_error`, `moderation_blocked` и идентификаторы запросов для отладки.	Google возвращает ошибки и статусы устаревания, специфичные для провайдера.	Нормализуйте категории ошибок в логах вашего шлюза.

Именно здесь полезен шлюз. Вы можете сосредоточить логику на стороне приложения на пресетах продукта и централизовать решения о маршрутизации для конкретных провайдеров. Но шлюз не может вывести требования вашего продукта. Контрольный список для маршрутов API GPT Image и Imagen должен включать точные комбинации параметров, на которые полагаются ваши пользователи, а не просто промпт «hello-world».

Проверки статуса в Flatkey для API GPT Image и Imagen

Публичное позиционирование Flatkey подкрепляет операционную причину создания этой страницы: один ключ, унифицированный доступ к моделям, обзор цен, аналитика использования, маршрутизация и панель управления для ключей и операций с моделями. Это полезно, когда команда сравнивает API GPT Image и Imagen, потому что сложная часть — это не одна демонстрация. Важно четко понимать, какой маршрут обслужил какой запрос и сколько это стоило.

Используйте этот рабочий процесс Flatkey, прежде чем выбрать производственный маршрут:

Откройте текущую страницу тарифов Flatkey и найдите точный ID модели, а не только имя провайдера.
Проверьте тип конечной точки для строки: image-generation, Gemini, OpenAI-совместимый чат или другое семейство.
Проверьте статус доступности и время последней проверки.
Отправьте один минимальный запрос через выбранный маршрут Flatkey.
Отправьте запрос с большим количеством параметров, указав размер, качество, количество изображений на выходе и средства контроля безопасности, которые использует ваш продукт.
Сравните структуру ответа с ответом от прямого маршрута провайдера.
Убедитесь, что логи запросов показывают модель, маршрут, статус, использование, поля стоимости, ключ владельца и детали сбоя.
Определите резервный маршрут до первого запуска в продакшен.

Для снимка, использованного в этой статье, соответствующие строки Flatkey не были симметричными. gemini-2.5-flash-image была помечена как доступная, и gemini-3-pro-image плюс gemini-3-pro-image-preview также были помечены как доступные. nano-banana-pro-preview была помечена как unknown_failure. gpt-image-2 была помечена как official_unsupported. Это делает производственную рекомендацию консервативной: используйте статью для структурирования сравнения, а затем запустите свежий каталог Flatkey и дымовое тестирование в день развертывания.

Если вы переносите клиентский код, используйте эту статью вместе с руководством по миграции на OpenAI-совместимые API. Конкретно для генерации изображений миграция не всегда сводится к простой замене базового URL, поскольку семейство конечных точек, доступность модели, значения по умолчанию для количества изображений и единицы тарификации могут измениться.

Практический контрольный список для API GPT Image и Imagen

Используйте этот контрольный список, когда инженер, менеджер по продукту или финансовый ревизор спросит, готов ли маршрут.

Проверка	Условие прохождения
Статус модели	Точный ID модели существует в документации провайдера и в каталоге шлюза, который вы планируете использовать.
Устаревание	Для рабочих нагрузок Imagen существует план миграции до 17 августа 2026 года или документированная причина для временного сохранения Imagen.
Семейство конечных точек	Запрос использует правильный путь для выбранной строки, а не предполагаемую OpenAI-совместимую конечную точку.
Единица тарификации	Команда нормализовала затраты на токены GPT Image, затраты на изображение для Imagen, затраты на токены/изображения для Nano Banana и затраты на маршруты Flatkey.
Количество выходных данных	Параметры `n`, `numberOfImages` или `sampleCount` заданы явно.
Размер и качество	Предустановки продукта сопоставлены для каждого провайдера.
Референсные изображения	Рабочие процессы редактирования/использования референсов учитывают токены входных изображений или специфичные для провайдера ограничения.
Средства контроля безопасности	Проверены модерация, генерация изображений людей, региональные ограничения и обработка заблокированных запросов.
Логирование	Поля ID запроса, модели, маршрута, статуса, использования и стоимости видны инженерному и финансовому отделам.
Резервный вариант	Существует известная резервная модель или прямой путь к провайдеру на случай, если маршрут шлюза изменит свое состояние.

Первый тест Flatkey должен быть простым. Выберите один промпт, один результат, один известный размер и один ключ владельца. Убедитесь, что результат получен, запрос появился в логах, поле стоимости можно проверить, а статус строки соответствует использованному маршруту. Только после этого добавляйте несколько результатов, высокое качество, референсные изображения, потоковую передачу или производственный трафик.

Какой маршрут выбрать?

Выбирайте GPT Image, если ваша рабочая нагрузка ориентирована на OpenAI, ваша команда хочет использовать функции GPT Image напрямую, а текущая проверка учетной записи и статус маршрута подтверждены. Этот вариант особенно привлекателен, когда ваша модель затрат уже рассчитана на учет токенов OpenAI и когда вам требуется поведение инструмента для работы с изображениями Image API или Responses API.

Выбирайте маршрут Google Nano Banana, если ваш существующий план Imagen на самом деле является планом генерации изображений Google, и вы хотите избежать прекращения поддержки Imagen. Ознакомьтесь с текущим списком моделей Nano Banana и страницей с ценами, поскольку Google теперь разделяет возможности генерации изображений между несколькими моделями изображений Gemini, каждая из которых имеет разное качество, задержку, обоснованность, разрешение и ценовое поведение.

Сохраняйте Imagen только в том случае, если вы уже зависите от специфического поведения Imagen и у вас есть краткосрочный, датированный план миграции. Предупреждение Google делает Imagen временным исключением, а не новой интеграцией по умолчанию.

Используйте Flatkey, когда ваша реальная проблема заключается в управлении множеством учетных записей провайдеров, ключей, единиц тарификации, логов запросов и решений о маршрутизации. Flatkey наиболее эффективен после того, как строка модели проверена, а поведение маршрута соответствует вашей рабочей нагрузке. После прохождения проверки статуса получите ключ и сделайте первый тест GPT Image vs Imagen API достаточно узким, чтобы сбои было легко объяснить.

Часто задаваемые вопросы

Сравнение GPT Image и Imagen API — это в основном сравнение качества?

Нет. Качество имеет значение, но производственные команды должны сравнивать структуру конечной точки, единицу тарификации, значения по умолчанию для количества выходных данных, средства контроля безопасности, риск устаревания, логи и доступность маршрута. Красивого образца изображения недостаточно для запуска.

Является ли Imagen API устаревшим?

В текущем руководстве Google по Imagen говорится, что модели Imagen устарели и будут отключены 17 августа 2026 года. Руководство рекомендует перейти на Nano Banana для генерации изображений.

Как тарифицируется GPT Image?

Руководство OpenAI по GPT Image оценивает стоимость на основе токенов входного текста, токенов входных изображений для рабочих процессов редактирования/использования референсов и токенов выходных изображений. Размер, качество и частичные изображения могут изменить оценку, поэтому перед составлением бюджета используйте текущую страницу цен и калькулятор OpenAI.

Как тарифицируется Imagen 4?

На странице цен Google указаны цены за изображение для платных уровней Imagen 4 Fast, Standard и Ultra. Поскольку эти модели устарели, при новых сравнениях следует также проверять цены на Nano Banana и сроки миграции.

Может ли Flatkey маршрутизировать запросы как к GPT Image, так и к моделям изображений Google?

Публичный интерфейс продукта Flatkey поддерживает унифицированный доступ к моделям, просмотр цен и несколько семейств конечных точек, но доступность маршрута зависит от конкретной модели. На момент создания снимка для этой статьи 5 июля 2026 года некоторые строки моделей изображений Google были доступны, в то время как gpt-image-2 был помечен как official_unsupported. Всегда перепроверяйте текущий каталог и проводите дымовое тестирование.

Что мне следует протестировать в первую очередь через Flatkey?

Начните с одного изображения, одного промпта, одного явно заданного размера, одного явно заданного качества или пресета модели и одного ключа владельца. Затем проверьте лог запросов, статус маршрута, поля использования и стоимость, прежде чем добавлять запросы на несколько изображений или производственный трафик.