Model and Modality Playbooks5 de julho de 2026Big Y

GPT Image vs Imagen API: Unidades de Preço e Verificações de Requisição

Use esta lista de verificação GPT Image vs Imagen API para comparar unidades de preço, parâmetros de requisição, risco de descontinuação e verificações de status do gateway Flatkey.

GPT Image vs Imagen API não é mais uma simples disputa de qualidade. Para equipes de produção, a comparação útil é operacional: qual formato de API seus clientes chamam, qual unidade de preço o financeiro pode conciliar, de quais parâmetros de imagem seu produto depende e se sua rota de gateway está realmente disponível no dia do lançamento.

A versão curta: GPT Image é agora um caminho de geração de imagens com preço por token na API da OpenAI, com gpt-image-2 exposto através da API de Imagem e ferramentas de geração de imagem na API de Respostas. O Imagen 4 ainda é documentado pelo Google com preços por imagem, mas o Google marca os modelos Imagen como obsoletos e diz que eles serão desativados em 17 de agosto de 2026. Equipes que comparam GPT Image vs Imagen API devem, portanto, incluir uma terceira verificação: se a carga de trabalho do Google deve ser movida para a família de geração de imagens Nano Banana antes de qualquer novo trabalho de integração.

O Flatkey pode simplificar a camada operacional com uma chave, uma URL base, revisão de uso e verificações de rota entre famílias de modelos. Isso não elimina a necessidade de verificar o status do modelo. No snapshot da API de preços do Flatkey de 5 de julho de 2026 para este artigo, gpt-image-2 aparecia no catálogo, mas estava marcado como official_unsupported, enquanto gemini-2.5-flash-image, gemini-3-pro-image e gemini-3-pro-image-preview estavam marcados como disponíveis. Trate isso como a lição principal: compare as APIs dos provedores e, em seguida, comprove a linha exata do Flatkey antes do tráfego de produção.

Resposta Rápida: GPT Image vs Imagen API

Área de decisão	API GPT Image	API Imagen	O que verificar através do Flatkey
Caminho do modelo atual	A OpenAI documenta os modelos GPT Image, incluindo `gpt-image-2`.	O Google documenta o Imagen 4, mas marca os modelos Imagen como obsoletos.	Confirme a linha exata do modelo, a família de endpoints e o status de disponibilidade na visualização atual de preços/catálogo.
Formato do endpoint principal	`POST /v1/images/generations` para geração da API de Imagem; a geração de imagem também pode ser executada como uma ferramenta da API de Respostas.	`generate_images` nos SDKs ou chamadas REST `:predict` para o Imagen 4.	Verifique se a rota usa `/v1/images/generations`, `generateContent` do Gemini ou um endpoint semelhante a chat compatível com OpenAI.
Unidade de preço	A OpenAI estima o custo do GPT Image a partir dos tokens de texto de entrada, tokens de imagem de entrada para edições e tokens de imagem de saída.	O Google lista o Imagen 4 Fast, Standard e Ultra com preços por imagem em níveis pagos.	Normalize as unidades do provedor antes de comparar com as proporções de modelo do Flatkey, logs de requisição e revisão de faturas.
Parâmetros principais	`model`, `prompt`, `size`, `quality`, formato/compressão de saída, fundo, streaming e imagens parciais.	`model`, `prompt`, `numberOfImages`, `imageSize`, `aspectRatio` e `personGeneration`.	Envie uma requisição de imagem básica, depois uma requisição com muitos parâmetros, e salve os campos de ID da requisição, uso, status e custo.
Risco de migração	A rota do GPT Image depende do acesso ao modelo, verificação da organização e permissões atuais da conta.	Os modelos Imagen têm um aviso de desativação datado; novos trabalhos com imagens do Google devem avaliar os modelos Nano Banana.	Não confie em uma menção na página inicial ou em um artigo antigo. Verifique a linha atual e o caminho de fallback.

Se você precisa apenas de um fluxo de trabalho atual de geração de imagens da OpenAI, comece com o GPT Image e a API de Imagem. Se você tem uma integração existente com o Imagen, sua comparação entre GPT Image e Imagen API deve incluir um plano de migração, pois a documentação atual do Imagen contém uma data de desativação. Se você usa o Flatkey, use a comparação para decidir o que testar e, em seguida, deixe a página de preços, o painel e os logs de requisição comprovarem a rota real.

Fatos Atuais do Provedor a Serem Verificados Primeiro

O guia de geração de imagens da OpenAI diz que a API pode gerar e editar imagens com os modelos GPT Image, incluindo gpt-image-2. Ele distingue a API de Imagem da API de Respostas: a API de Imagem fornece endpoints diretos de geração e edição, enquanto a API de Respostas pode invocar a geração de imagens como uma ferramenta dentro de fluxos de múltiplos turnos. A página do modelo GPT Image 2 da OpenAI lista o ID do modelo gpt-image-2 e o snapshot atual gpt-image-2-2026-04-21.

Isso não significa que toda conta de gateway possa roteá-lo hoje. A OpenAI observa que os modelos GPT Image podem exigir verificação da organização da API. O snapshot da API de preços do Flatkey no dia da publicação mostrou gpt-image-2 no catálogo com os tipos de endpoint image-generation e openai, mas o status da linha era official_unsupported. Antes de colocar a comparação GPT Image vs Imagen API em uma política de roteamento de produção, confirme se sua conta Flatkey tem uma rota GPT Image utilizável ou se o acesso direto à OpenAI é necessário para essa carga de trabalho.

O guia do Imagen do Google diz que o Imagen é o modelo de geração de imagens de alta fidelidade do Google e que as imagens geradas incluem uma marca d'água SynthID. A mesma página agora marca os modelos Imagen como obsoletos, com desativação em 17 de agosto de 2026, e recomenda a migração para o Nano Banana para geração de imagens. Sua seção de migração diz para usar gemini-2.5-flash-image em vez dos nomes de modelo do Imagen, usar client.models.generate_content em vez de client.models.generate_images e lidar com as partes de conteúdo da resposta do Nano Banana em vez de um objeto de resposta de imagem dedicado do Imagen.

O guia de geração de imagens atual do Google direciona os leitores para os modelos Nano Banana para a maioria dos casos de uso, incluindo Gemini 3.1 Flash Image, Gemini 3.1 Flash Lite Image, Gemini 3 Pro Image e Gemini 2.5 Flash Image. É por isso que um artigo moderno sobre GPT Image vs Imagen API não deve enquadrar o Imagen 4 como a escolha padrão para novas implementações. É uma comparação de legado ou migração, a menos que seu projeto tenha um motivo específico para manter o Imagen até a data de desativação.

Unidades de Preço: Não Compare um Único Preço de Destaque

O preço é onde as comparações entre GPT Image e Imagen API costumam dar errado. A OpenAI e o Google expõem unidades diferentes, e essas unidades mudam dependendo se a requisição é de texto para imagem, edição/imagem de referência, streaming, em lote ou roteada por meio de um gateway.

Campo de preço	Verificação do GPT Image	Verificação do Imagen	Verificação do Flatkey
Unidade de saída	Os exemplos do GPT Image 2 da OpenAI usam tokens de saída de imagem e uma calculadora para tamanho e qualidade.	O Google lista os preços do Imagen 4 por imagem de saída.	Confirme como a rota registra o custo da requisição e se a linha do Flatkey expõe as proporções de modelo, conclusão, cache ou imagem.
Unidade de entrada	As requisições do GPT Image incluem tokens de texto de entrada, e as edições podem incluir tokens de imagem de entrada.	A geração do Imagen 4 é precificada por imagem na página de preços do Google, enquanto o Nano Banana inclui preços de tokens de entrada.	Verifique se os custos do prompt e da imagem de referência aparecem nos registros de uso para a rota selecionada.
Qualidade e tamanho	`quality` e `size` influenciam as estimativas de tokens de saída.	O Imagen 4 tem preços para os modelos Fast, Standard e Ultra; `imageSize` suporta 1K e 2K para Standard e Ultra.	Teste a combinação exata de tamanho/qualidade que você planeja lançar.
Múltiplas imagens	O `n` da OpenAI gera várias imagens em uma única requisição; o custo escala com as saídas geradas.	O Imagen suporta `numberOfImages` de 1 a 4, com padrão de 4.	Não deixe que uma configuração padrão de várias imagens surpreenda na revisão da fatura.
Streaming	O streaming parcial de imagens da OpenAI pode adicionar tokens de saída para cada imagem parcial.	A documentação do Imagen enfatiza respostas de imagem geradas, não o mesmo formato de streaming do GPT Image.	Decida se as imagens intermediárias são desativadas, registradas ou tratadas como saídas faturáveis.

O guia de imagens da OpenAI lista estimativas de saída de exemplo do GPT Image 2 para tamanhos comuns. Em 1024 x 1024, os exemplos mostram baixa qualidade a US$ 0,006, média a US$ 0,053 e alta a US$ 0,211. O mesmo guia diz que o custo final é a soma dos tokens de texto de entrada, tokens de imagem de entrada ao editar e tokens de saída de imagem. Use esses exemplos como uma verificação de unidade, não como um orçamento permanente, porque a OpenAI direciona os leitores para a página de preços atual e a calculadora para estimativas finais.

A página de preços da API Gemini do Google lista o Imagen 4 Fast a US$ 0,02 por imagem, o Imagen 4 Standard a US$ 0,04 por imagem e o Imagen 4 Ultra a US$ 0,06 por imagem no nível pago. A mesma seção avisa que os IDs de modelo do Imagen 4 estão obsoletos e serão desativados em 17 de agosto de 2026. Na seção Nano Banana, o Google lista a entrada do gemini-2.5-flash-image a US$ 0,30 por 1 milhão de tokens de texto/imagem e a saída a US$ 0,039 por imagem para saída de 1024px, com um preço de token de saída de imagem subjacente de US$ 30 por 1 milhão de tokens.

A regra financeira prática é simples: converta os custos de GPT Image vs Imagen API em uma planilha de requisições. Inclua tokens de prompt, imagens de referência, contagem de saídas, qualidade, tamanho, modo de geração, parciais de streaming e status da linha do gateway. Em seguida, compare a planilha com a abordagem de comparação de preços de modelos de IA da Flatkey e a página de preços atual da Flatkey.

Formato da Requisição: O Que Seu Cliente Realmente Envia

GPT Image e Imagen parecem semelhantes apenas no nível da categoria de produto. Os formatos das requisições são diferentes o suficiente para que uma migração deva ser explícita.

Para a geração de GPT Image por meio da API de Imagem, a referência da OpenAI para /v1/images/generations requer um corpo JSON e retorna dados de imagem em base64 por padrão. A especificação OpenAPI também mostra campos de uso, como tokens totais, de entrada e de saída nas respostas de imagem. Uma requisição mínima verifica o modelo, o prompt, a contagem de saídas e o tratamento de saída padrão:

curl -X POST "https://api.openai.com/v1/images/generations" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "Uma maquete de produto limpa em uma superfície de estúdio branca",
    "size": "1024x1024",
    "quality": "medium",
    "n": 1
  }'

Para o Imagen 4 por meio do caminho REST da API Gemini, o guia do Google mostra uma chamada :predict para uma URL específica do modelo com instances e parameters:

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "instances": [
      { "prompt": "Robô segurando um skate vermelho" }
    ],
    "parameters": {
      "sampleCount": 4
    }
  }'

Para a Flatkey, não presuma uma forma universal. O snapshot da API de preços de 5 de julho de 2026 listou uma família de endpoints image-generation com o caminho /v1/images/generations, uma família de endpoints gemini com o caminho /v1beta/models/{model}:generateContent e uma família de endpoints de chat openai com o caminho /v1/chat/completions. No mesmo snapshot, gemini-2.5-flash-image estava disponível através dos tipos de endpoint gemini e openai, enquanto gpt-image-2 não estava utilizável no momento. Seu teste de rota deve usar a família de endpoints que a linha do catálogo realmente suporta.

Parâmetros de Requisição que Quebram Migrações

A maioria das surpresas na comparação entre a API GPT Image e a Imagen são surpresas de parâmetros. As APIs não usam os mesmos nomes, padrões ou controles de segurança.

Área do parâmetro	Verificação da API GPT Image	Verificação da API Imagen	Nota de migração
Idioma do prompt	A OpenAI suporta prompts de texto para modelos GPT Image.	O guia da Imagen do Google diz que a Imagen suporta apenas prompts em inglês no momento.	Se seu aplicativo aceita prompts multilíngues, teste o comportamento da saída direta antes da migração.
Contagem de saídas	`n` controla a contagem de imagens.	`numberOfImages` ou `sampleCount` REST controla a contagem de imagens, de 1 a 4; o padrão é 4.	Sempre defina a contagem de saídas explicitamente.
Tamanho e proporção	O GPT Image 2 aceita tamanhos flexíveis dentro das restrições documentadas; exemplos comuns incluem formatos de 1024 quadrado, 2K e 4K.	A Imagen expõe `imageSize` para 1K/2K nos modelos Standard e Ultra e valores de `aspectRatio` como 1:1, 3:4, 4:3, 9:16 e 16:9.	Mapeie as predefinições do produto em vez de passar os parâmetros antigos cegamente.
Qualidade	O GPT Image usa `low`, `medium`, `high` ou `auto`.	A qualidade da Imagen é em parte uma escolha de modelo: Fast, Standard ou Ultra.	Um seletor de "alta qualidade" pode precisar de mapeamento específico do provedor.
Geração de pessoas	A OpenAI lida com a segurança da imagem através de moderação e filtros de política.	A Imagen documenta valores de `personGeneration` como `dont_allow`, `allow_adult` e `allow_all`, com restrições regionais.	Se seu aplicativo gera pessoas, esta é uma verificação que bloqueia o lançamento.
Transparência	A OpenAI diz que o `gpt-image-2` não suporta fundos transparentes no momento.	A configuração de geração citada da Imagen não é um substituto direto para os controles de fundo da OpenAI.	Não migre fluxos de trabalho de ativos transparentes sem um teste de amostra.
Erros e moderação	A OpenAI documenta `image_generation_user_error`, `moderation_blocked` e IDs de requisição para depuração.	O Google retorna erros específicos do provedor e estados de descontinuação.	Normalize as categorias de erro em seus logs de gateway.

É aqui que um gateway é útil. Você pode manter a lógica do lado da aplicação focada em predefinições de produto e centralizar as decisões de roteamento específicas do provedor. Mas o gateway não pode inferir os requisitos do seu produto. Uma lista de verificação de rotas para GPT Image vs Imagen API deve incluir as combinações exatas de parâmetros nas quais seus usuários confiam, não apenas um prompt de "olá, mundo".

Verificações de Status da Flatkey para GPT Image vs Imagen API

O posicionamento público da Flatkey apoia a razão operacional para esta página: uma chave, acesso unificado a modelos, revisão de preços, análise de uso, roteamento e um painel para chaves e operações de modelo. Isso é útil quando uma equipe está comparando a API GPT Image com a Imagen, porque a parte difícil não é uma única demonstração. É manter a clareza sobre qual rota atendeu a qual requisição e quanto custou.

Use este fluxo de trabalho da Flatkey antes de escolher uma rota de produção:

Abra a página de preços atual da Flatkey e pesquise o ID exato do modelo, não apenas o nome do provedor.
Verifique o tipo de endpoint para a linha: image-generation, Gemini, chat compatível com OpenAI ou outra família.
Verifique o status de disponibilidade e a hora da última verificação.
Envie uma requisição mínima através da rota Flatkey selecionada.
Envie uma requisição com muitos parâmetros, incluindo tamanho, qualidade, contagem de saídas e controles de segurança que seu produto usa.
Compare o formato da resposta com a rota direta do provedor.
Confirme se os logs de requisição mostram os campos de modelo, rota, status, uso, custo, chave do proprietário e detalhes da falha.
Decida a rota de fallback antes da primeira execução em produção.

Para o snapshot deste artigo, as linhas relevantes da Flatkey não eram simétricas. gemini-2.5-flash-image estava marcado como disponível, e gemini-3-pro-image mais gemini-3-pro-image-preview estavam marcados como disponíveis. nano-banana-pro-preview estava marcado como unknown_failure. gpt-image-2 estava marcado como official_unsupported. Isso torna a recomendação de produção conservadora: use o artigo para estruturar a comparação e, em seguida, execute um novo catálogo da Flatkey e um teste rápido (smoke test) no dia da implantação.

Se você está migrando o código do cliente, combine este artigo com o guia de migração de API compatível com OpenAI. Especificamente para a geração de imagens, a migração nem sempre é uma simples troca de URL base, pois a família de endpoints, a disponibilidade do modelo, os padrões de contagem de imagens e as unidades de preço podem mudar.

Uma Lista de Verificação Prática para GPT Image vs Imagen API

Use esta lista de verificação quando um revisor de engenharia, produto ou finanças perguntar se uma rota está pronta.

Verificação	Condição de aprovação
Status do modelo	O ID exato do modelo existe na documentação do provedor e no catálogo do gateway que você planeja usar.
Descontinuação	As cargas de trabalho do Imagen têm um plano de migração para 17 de agosto de 2026 ou um motivo documentado para manter o Imagen temporariamente.
Família de endpoints	A requisição usa o caminho correto para a linha selecionada, não um endpoint compatível com OpenAI adivinhado.
Unidade de preço	A equipe normalizou os custos de token do GPT Image, os custos por imagem do Imagen, os custos de token/imagem do Nano Banana e os custos de rota do Flatkey.
Contagem de saídas	`n`, `numberOfImages` ou `sampleCount` está definido explicitamente.
Tamanho e qualidade	As predefinições de produto são mapeadas provedor por provedor.
Imagens de referência	Os fluxos de trabalho de edição/referência levam em conta os tokens de imagem de entrada ou os limites específicos do provedor.
Controles de segurança	Moderação, geração de pessoas, restrições regionais e tratamento de requisições bloqueadas são testados.
Registro (Logging)	Os campos de ID da requisição, modelo, rota, status, uso e custo são visíveis para engenharia e finanças.
Fallback	Existe um modelo de fallback conhecido ou um caminho direto para o provedor se a rota do gateway mudar de estado.

O primeiro teste do Flatkey deve ser simples. Escolha um prompt, uma saída, um tamanho conhecido e uma chave de proprietário. Confirme que o resultado chega, que a requisição aparece nos logs, que o campo de custo é inspecionável e que o status da linha corresponde à rota que você usou. Só então adicione múltiplas saídas, alta qualidade, imagens de referência, streaming ou tráfego de produção.

Qual Rota Você Deve Escolher?

Escolha o GPT Image quando sua carga de trabalho for centrada em OpenAI, sua equipe quiser recursos diretos do GPT Image e a verificação da conta atual mais o status da rota estiverem confirmados. É especialmente atraente quando seu modelo de custo já espera a contabilidade baseada em tokens da OpenAI e quando você precisa do comportamento da ferramenta de imagem da API de Imagem ou da API de Respostas.

Escolha uma rota do Google Nano Banana quando seu plano Imagen existente for, na verdade, um plano de geração de imagens do Google e você quiser evitar o desligamento do Imagen. Revise a lista de modelos e a página de preços atuais do Nano Banana, pois o Google agora divide as opções de geração de imagens em vários modelos de imagem Gemini, cada um com diferentes comportamentos de qualidade, latência, fundamentação, resolução e preço.

Mantenha o Imagen apenas quando você já depender do comportamento específico do Imagen e tiver um plano de migração curto e datado. O aviso do Google torna o Imagen uma exceção temporária, não uma nova integração padrão.

Use o Flatkey quando seu problema real for operar muitas contas de provedores, chaves, unidades de preço, logs de requisição e decisões de rota. O Flatkey é mais forte depois que a linha do modelo é verificada e o comportamento da rota corresponde à sua carga de trabalho. Após a verificação de status ser aprovada, obtenha uma chave e mantenha o primeiro teste GPT Image vs Imagen API restrito o suficiente para que as falhas sejam fáceis de explicar.

FAQ

GPT Image vs Imagen API é principalmente uma comparação de qualidade?

Não. A qualidade importa, mas as equipes de produção devem comparar o formato do endpoint, a unidade de preço, os padrões de contagem de saídas, os controles de segurança, o risco de descontinuação, os logs e a disponibilidade da rota. Uma bela imagem de amostra não é evidência suficiente para o lançamento.

A API Imagen está descontinuada?

O guia atual do Imagen do Google diz que os modelos Imagen estão descontinuados e serão desligados em 17 de agosto de 2026. O guia recomenda a migração para o Nano Banana para geração de imagens.

Como o GPT Image é precificado?

As diretrizes do GPT Image da OpenAI estimam o custo a partir de tokens de texto de entrada, tokens de imagem de entrada para fluxos de trabalho de edição/referência e tokens de saída de imagem. Tamanho, qualidade e imagens parciais podem alterar a estimativa, portanto, use a página de preços e a calculadora atuais da OpenAI antes de fazer o orçamento.

Como o Imagen 4 é precificado?

A página de preços do Google lista o Imagen 4 Fast, Standard e Ultra com preços por imagem em níveis pagos. Como esses modelos estão descontinuados, novas comparações também devem verificar os preços e o cronograma de migração do Nano Banana.

O Flatkey pode rotear tanto o GPT Image quanto os modelos de imagem do Google?

A superfície pública do produto Flatkey suporta acesso unificado a modelos, revisão de preços e múltiplas famílias de endpoints, mas a disponibilidade da rota é específica do modelo. Na captura de 5 de julho de 2026 para este artigo, algumas linhas de imagem do Google estavam disponíveis, enquanto gpt-image-2 estava marcado como official_unsupported. Sempre verifique novamente o catálogo atual e execute um teste de fumaça (smoke test).

O que devo testar primeiro através do Flatkey?

Comece com uma imagem, um prompt, um tamanho explícito, uma qualidade explícita ou predefinição de modelo e uma chave de proprietário. Em seguida, verifique o log de requisições, o status da rota, os campos de uso e a revisão de custos antes de adicionar requisições de múltiplas imagens ou tráfego de produção.