Model and Modality Playbooks5 de julio de 2026Big Y

GPT Image vs Imagen API: Unidades de precios y comprobaciones de solicitudes

Usa esta checklist de GPT Image vs Imagen API para comparar unidades de precios, parámetros de solicitud, riesgo de obsolescencia y comprobaciones de estado del gateway de Flatkey.

GPT Image vs Imagen API ya no es un simple concurso de calidad. Para los equipos de producción, la comparación útil es operativa: qué forma de API utilizan las llamadas de su cliente, qué unidad de precios puede conciliar el departamento financiero, de qué parámetros de imagen depende su producto y si su ruta de puerta de enlace está realmente disponible el día del lanzamiento.

La versión corta: GPT Image es ahora una ruta de generación de imágenes con precio por token en la API de OpenAI, con gpt-image-2 expuesto a través de la API de Imagen y herramientas de generación de imágenes en la API de Respuestas. Imagen 4 todavía está documentado por Google con precios por imagen, pero Google marca los modelos de Imagen como obsoletos y dice que se cerrarán el 17 de agosto de 2026. Los equipos que comparen GPT Image vs Imagen API deberían, por lo tanto, incluir una tercera comprobación: si la carga de trabajo de Google debería trasladarse a la familia de generación de imágenes Nano Banana antes de cualquier nuevo trabajo de integración.

Flatkey puede simplificar la capa operativa con una clave, una URL base, revisión de uso y comprobaciones de ruta entre familias de modelos. No elimina la necesidad de verificar el estado del modelo. En la instantánea de la API de precios de Flatkey del 5 de julio de 2026 para este artículo, gpt-image-2 aparecía en el catálogo pero estaba marcado como official_unsupported, mientras que gemini-2.5-flash-image, gemini-3-pro-image y gemini-3-pro-image-preview estaban marcados como disponibles. Considere esa como la lección principal: compare las API de los proveedores y luego compruebe la fila exacta de Flatkey antes del tráfico de producción.

Respuesta rápida: GPT Image vs Imagen API

Área de decisión	API de GPT Image	API de Imagen	Qué comprobar a través de Flatkey
Ruta del modelo actual	OpenAI documenta los modelos de GPT Image, incluido `gpt-image-2`.	Google documenta Imagen 4, pero marca los modelos de Imagen como obsoletos.	Confirme la fila exacta del modelo, la familia de puntos de conexión y el estado de disponibilidad en la vista actual de precios/catálogo.
Forma del punto de conexión principal	`POST /v1/images/generations` para la generación de la API de Imagen; la generación de imágenes también puede ejecutarse como una herramienta de la API de Respuestas.	`generate_images` en los SDK o llamadas REST `:predict` para Imagen 4.	Compruebe si la ruta utiliza `/v1/images/generations`, `generateContent` de Gemini o un punto de conexión similar a un chat compatible con OpenAI.
Unidad de precios	OpenAI estima el costo de GPT Image a partir de los tokens de texto de entrada, los tokens de imagen de entrada para ediciones y los tokens de imagen de salida.	Google lista Imagen 4 Fast, Standard y Ultra como precios por imagen de nivel de pago.	Normalice las unidades de los proveedores antes de compararlas con las proporciones de modelos de Flatkey, los registros de solicitudes y la revisión de facturas.
Parámetros clave	`model`, `prompt`, `size`, `quality`, formato/compresión de salida, fondo, transmisión e imágenes parciales.	`model`, `prompt`, `numberOfImages`, `imageSize`, `aspectRatio` y `personGeneration`.	Envíe una solicitud de imagen básica, luego una solicitud con muchos parámetros, y guarde los campos de ID de solicitud, uso, estado y costo.
Riesgo de migración	La ruta de GPT Image depende del acceso al modelo, la verificación de la organización y los permisos actuales de la cuenta.	Los modelos de Imagen tienen una advertencia de cierre con fecha; el nuevo trabajo con imágenes de Google debería revisar los modelos Nano Banana.	No confíe en una mención en la página de inicio o en un artículo antiguo. Verifique la fila actual y la ruta de respaldo.

Si solo necesita un flujo de trabajo de generación de imágenes de OpenAI actual, comience con GPT Image y la API de Imagen. Si tiene una integración de Imagen existente, su comparación entre GPT Image y la API de Imagen debería incluir un plan de migración porque los documentos actuales de Imagen tienen una fecha de cierre. Si usa Flatkey, utilice la comparación para decidir qué probar y luego deje que la página de precios, el panel de control y los registros de solicitudes demuestren la ruta real.

Datos actuales del proveedor que debe comprobar primero

La guía de generación de imágenes de OpenAI dice que la API puede generar y editar imágenes con los modelos de GPT Image, incluido gpt-image-2. Distingue la API de Imagen de la API de Respuestas: la API de Imagen proporciona puntos de conexión directos de generación y edición, mientras que la API de Respuestas puede invocar la generación de imágenes como una herramienta dentro de flujos de varios turnos. La página del modelo GPT Image 2 de OpenAI lista el ID del modelo gpt-image-2 y la instantánea actual gpt-image-2-2026-04-21.

Eso no significa que todas las cuentas de puerta de enlace puedan enrutarlo hoy. OpenAI señala que los modelos de GPT Image pueden requerir la verificación de la organización de la API. La instantánea de la API de precios del día de publicación de Flatkey mostró gpt-image-2 en el catálogo con los tipos de punto de conexión image-generation y openai, pero el estado de la fila era official_unsupported. Antes de incluir GPT Image vs Imagen API en una política de enrutamiento de producción, confirme si su cuenta de Flatkey tiene una ruta de GPT Image utilizable o si se requiere acceso directo a OpenAI para esa carga de trabajo.

La guía de Imagen de Google dice que Imagen es el modelo de generación de imágenes de alta fidelidad de Google y que las imágenes generadas incluyen una marca de agua SynthID. La misma página ahora marca los modelos de Imagen como obsoletos, con cierre el 17 de agosto de 2026, y recomienda la migración a Nano Banana para la generación de imágenes. Su sección de migración dice que se debe usar gemini-2.5-flash-image en lugar de los nombres de los modelos de Imagen, usar client.models.generate_content en lugar de client.models.generate_images, y manejar las partes del contenido de la respuesta de Nano Banana en lugar de un objeto de respuesta de imagen de Imagen dedicado.

La guía de generación de imágenes actual de Google dirige a los lectores a los modelos Nano Banana para la mayoría de los casos de uso, incluidos Gemini 3.1 Flash Image, Gemini 3.1 Flash Lite Image, Gemini 3 Pro Image y Gemini 2.5 Flash Image. Por eso, un artículo moderno sobre GPT Image vs Imagen API no debería presentar a Imagen 4 como la opción predeterminada para nuevas implementaciones. Es una comparación de legado o migración, a menos que tu proyecto tenga una razón específica para mantener Imagen hasta la fecha de cierre.

Unidades de precios: No compares un único precio principal

El precio es donde las comparaciones entre GPT Image e Imagen API suelen fallar. OpenAI y Google exponen diferentes unidades, y esas unidades cambian dependiendo de si la solicitud es de texto a imagen, de edición/imagen de referencia, de transmisión (streaming), por lotes o enrutada a través de una puerta de enlace.

Campo de precios	Comprobación de GPT Image	Comprobación de Imagen	Comprobación de Flatkey
Unidad de salida	Los ejemplos de GPT Image 2 de OpenAI utilizan tokens de salida de imagen y una calculadora para el tamaño y la calidad.	Google lista los precios de Imagen 4 por imagen de salida.	Confirma cómo la ruta registra el costo de la solicitud y si la fila de Flatkey expone las proporciones de modelo, finalización, caché o imagen.
Unidad de entrada	Las solicitudes de GPT Image incluyen tokens de texto de entrada, y las ediciones pueden incluir tokens de imagen de entrada.	La generación con Imagen 4 se cobra por imagen en la página de precios de Google, mientras que Nano Banana incluye los precios de los tokens de entrada.	Verifica si los costos de la instrucción (prompt) y de la imagen de referencia aparecen en los registros de uso para la ruta seleccionada.
Calidad y tamaño	`quality` y `size` influyen en las estimaciones de tokens de salida.	Imagen 4 tiene precios para los modelos Fast, Standard y Ultra; `imageSize` admite 1K y 2K para Standard y Ultra.	Prueba la combinación exacta de tamaño/calidad que planeas implementar.
Múltiples imágenes	El parámetro `n` de OpenAI genera múltiples imágenes en una sola solicitud; el costo escala con las salidas generadas.	Imagen admite `numberOfImages` de 1 a 4, con un valor predeterminado de 4.	No dejes que una configuración predeterminada de múltiples imágenes te sorprenda en la revisión de la facturación.
Transmisión (Streaming)	La transmisión parcial de imágenes de OpenAI puede agregar tokens de salida por cada imagen parcial.	La documentación de Imagen enfatiza las respuestas de imágenes generadas, no la misma forma de transmisión que GPT Image.	Decide si las imágenes intermedias se deshabilitan, se registran o se tratan como salidas facturables.

La guía de imágenes de OpenAI lista estimaciones de salida de ejemplo para GPT Image 2 para tamaños comunes. A 1024 x 1024, los ejemplos muestran baja calidad a 0,006 $, media a 0,053 $ y alta a 0,211 $. La misma guía dice que el costo final es la suma de los tokens de texto de entrada, los tokens de imagen de entrada al editar y los tokens de imagen de salida. Usa esos ejemplos como una comprobación de unidades, no como un presupuesto permanente, porque OpenAI dirige a los lectores a la página de precios actual y a la calculadora para obtener estimaciones finales.

La página de precios de la API de Gemini de Google lista Imagen 4 Fast a 0,02 $ por imagen, Imagen 4 Standard a 0,04 $ por imagen e Imagen 4 Ultra a 0,06 $ por imagen en el nivel de pago. La misma sección advierte que los ID de modelo de Imagen 4 están obsoletos y se darán de baja el 17 de agosto de 2026. En la sección de Nano Banana, Google lista la entrada de gemini-2.5-flash-image a 0,30 $ por cada millón de tokens de texto/imagen y la salida a 0,039 $ por imagen para una salida de 1024px, con un precio subyacente de token de salida de imagen de 30 $ por cada millón de tokens.

La regla financiera práctica es simple: convierte los costos de GPT Image vs Imagen API en una hoja de trabajo de solicitudes. Incluye los tokens de la instrucción (prompt), las imágenes de referencia, el número de salidas, la calidad, el tamaño, el modo de generación, las parciales de transmisión (streaming) y el estado de la fila de la puerta de enlace. Luego, compara la hoja de trabajo con el enfoque de comparación de precios de modelos de IA de Flatkey y la página de precios actual de Flatkey.

Forma de la solicitud: Lo que tu cliente realmente envía

GPT Image e Imagen se parecen solo a nivel de categoría de producto. Las formas de las solicitudes son lo suficientemente diferentes como para que una migración deba ser explícita.

Para la generación con GPT Image a través de la API de Image, la referencia de OpenAI para /v1/images/generations requiere un cuerpo JSON y devuelve datos de imagen en base64 por defecto. La especificación OpenAPI también muestra campos de uso como tokens totales, de entrada y de salida en las respuestas de imagen. Una solicitud mínima comprueba el modelo, la instrucción (prompt), el número de salidas y el manejo de salida predeterminado:

curl -X POST "https://api.openai.com/v1/images/generations" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "Una maqueta de producto limpia sobre una superficie de estudio blanca",
    "size": "1024x1024",
    "quality": "medium",
    "n": 1
  }'

Para Imagen 4 a través de la ruta REST de la API de Gemini, la guía de Google muestra una llamada :predict a una URL específica del modelo con instances y parameters:

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "instances": [
      { "prompt": "Un robot sosteniendo un monopatín rojo" }
    ],
    "parameters": {
      "sampleCount": 4
    }
  }'

Para Flatkey, no asuma una forma universal. La instantánea de la API de precios del 5 de julio de 2026 listaba una familia de puntos de conexión image-generation con la ruta /v1/images/generations, una familia de puntos de conexión gemini con la ruta /v1beta/models/{model}:generateContent y una familia de puntos de conexión de chat openai con la ruta /v1/chat/completions. En la misma instantánea, gemini-2.5-flash-image estaba disponible a través de los tipos de punto de conexión gemini y openai, mientras que gpt-image-2 no se podía usar actualmente. Su prueba de ruta debe usar la familia de puntos de conexión que la fila del catálogo realmente admite.

Parámetros de solicitud que rompen las migraciones

La mayoría de las sorpresas de GPT Image vs Imagen API son sorpresas de parámetros. Las API no usan los mismos nombres, valores predeterminados o controles de seguridad.

Área de parámetros	Comprobación de la API de GPT Image	Comprobación de la API de Imagen	Nota de migración
Lenguaje del prompt	OpenAI admite prompts de texto para los modelos GPT Image.	La guía de Imagen de Google dice que Imagen admite prompts solo en inglés en este momento.	Si su aplicación acepta prompts multilingües, pruebe el comportamiento de la salida directa antes de la migración.
Recuento de salidas	`n` controla el número de imágenes.	`numberOfImages` o `sampleCount` de REST controla el número de imágenes, de 1 a 4; el valor predeterminado es 4.	Establezca siempre el recuento de salidas explícitamente.
Tamaño y aspecto	GPT Image 2 acepta tamaños flexibles dentro de las restricciones documentadas; los ejemplos comunes incluyen formatos de 1024 cuadrados, 2K y 4K.	Imagen expone `imageSize` para 1K/2K en Standard y Ultra y valores de `aspectRatio` como 1:1, 3:4, 4:3, 9:16 y 16:9.	Asigne preajustes de productos en lugar de pasar parámetros antiguos a ciegas.
Calidad	GPT Image usa `low`, `medium`, `high` o `auto`.	La calidad de Imagen es en parte una elección de modelo: Fast, Standard o Ultra.	Un interruptor de "alta calidad" puede necesitar una asignación específica del proveedor.
Generación de personas	OpenAI gestiona la seguridad de las imágenes a través de la moderación y los filtros de políticas.	Imagen documenta valores de `personGeneration` como `dont_allow`, `allow_adult` y `allow_all`, con restricciones regionales.	Si su aplicación genera personas, esta es una comprobación que bloquea el lanzamiento.
Transparencia	OpenAI dice que `gpt-image-2` no admite actualmente fondos transparentes.	La configuración de generación citada de Imagen no es un reemplazo directo para los controles de fondo de OpenAI.	No migre los flujos de trabajo de activos transparentes sin una prueba de muestra.
Errores y moderación	OpenAI documenta `image_generation_user_error`, `moderation_blocked` e ID de solicitud para la depuración.	Google devuelve errores específicos del proveedor y estados de desaprobación.	Normalice las categorías de error en los registros de su puerta de enlace.

Aquí es donde una puerta de enlace es útil. Puede mantener la lógica del lado de la aplicación centrada en los preajustes del producto y centralizar las decisiones de enrutamiento específicas del proveedor. Pero la puerta de enlace no puede inferir los requisitos de su producto. Una lista de verificación de rutas de GPT Image vs Imagen API debe incluir las combinaciones exactas de parámetros en las que confían sus usuarios, no solo un prompt de "hola mundo".

Comprobaciones de estado de Flatkey para GPT Image vs Imagen API

El posicionamiento público de Flatkey respalda la razón operativa de esta página: una clave, acceso unificado a modelos, revisión de precios, análisis de uso, enrutamiento y un panel para claves y operaciones de modelos. Estos son útiles cuando un equipo está comparando GPT Image vs Imagen API porque la parte difícil no es una sola demostración. Es mantenerse claro sobre qué ruta atendió qué solicitud y cuánto costó.

Use este flujo de trabajo de Flatkey antes de elegir una ruta de producción:

Abra la página de precios de Flatkey actual y busque el ID exacto del modelo, no solo el nombre del proveedor.
Compruebe el tipo de punto de conexión para la fila: image-generation, Gemini, chat compatible con OpenAI u otra familia.
Compruebe el estado de disponibilidad y la última hora de comprobación.
Envíe una solicitud mínima a través de la ruta de Flatkey seleccionada.
Envíe una solicitud con muchos parámetros con el tamaño, la calidad, el recuento de salidas y los controles de seguridad que utiliza su producto.
Compare la forma de la respuesta con la ruta directa del proveedor.
Confirme que los registros de solicitudes muestren los campos de modelo, ruta, estado, uso, costo, clave del propietario y detalles del fallo.
Decida la ruta de respaldo antes de la primera ejecución de producción.

Para la instantánea de este artículo, las filas relevantes de Flatkey no eran simétricas. gemini-2.5-flash-image estaba marcado como disponible, y gemini-3-pro-image más gemini-3-pro-image-preview estaban marcados como disponibles. nano-banana-pro-preview estaba marcado como unknown_failure. gpt-image-2 estaba marcado como official_unsupported. Eso hace que la recomendación de producción sea conservadora: use el artículo para estructurar la comparación, luego ejecute un catálogo de Flatkey nuevo y una prueba de humo el día que lo implemente.

Si está migrando código de cliente, combine este artículo con la guía de migración de API compatible con OpenAI. Específicamente para la generación de imágenes, la migración no siempre es un simple cambio de URL base porque la familia de puntos de conexión, la disponibilidad del modelo, los valores predeterminados del recuento de imágenes y las unidades de precios pueden cambiar.

Una lista de verificación práctica de GPT Image vs Imagen API

Use esta lista de verificación cuando un revisor de ingeniería, producto o finanzas pregunte si una ruta está lista.

Comprobación	Condición de aprobación
Estado del modelo	El ID exacto del modelo existe en la documentación del proveedor y en el catálogo de la puerta de enlace que planeas usar.
Obsolescencia	Las cargas de trabajo de Imagen tienen un plan de migración para el 17 de agosto de 2026 o una razón documentada para mantener Imagen temporalmente.
Familia de endpoints	La solicitud utiliza la ruta correcta para la fila seleccionada, no un endpoint compatible con OpenAI adivinado.
Unidad de precios	El equipo ha normalizado los costos de los tokens de GPT Image, los costos por imagen de Imagen, los costos de token/imagen de Nano Banana y los costos de ruta de Flatkey.
Recuento de salidas	`n`, `numberOfImages` o `sampleCount` se establece explícitamente.
Tamaño y calidad	Los preajustes de productos se mapean proveedor por proveedor.
Imágenes de referencia	Los flujos de trabajo de edición/referencia tienen en cuenta los tokens de imagen de entrada o los límites específicos del proveedor.
Controles de seguridad	Se prueban la moderación, la generación de personas, las restricciones regionales y el manejo de solicitudes bloqueadas.
Registro	Los campos de ID de solicitud, modelo, ruta, estado, uso y costo son visibles para ingeniería y finanzas.
Alternativa	Existe un modelo alternativo conocido o una ruta directa al proveedor si la ruta de la puerta de enlace cambia de estado.

La primera prueba de Flatkey debería ser aburrida. Elige una instrucción, una salida, un tamaño conocido y una clave de propietario. Confirma que el resultado llega, que la solicitud aparece en los registros, que el campo de costo es inspeccionable y que el estado de la fila coincide con la ruta que utilizaste. Solo entonces añade múltiples salidas, alta calidad, imágenes de referencia, streaming o tráfico de producción.

¿Qué ruta deberías elegir?

Elige GPT Image cuando tu carga de trabajo esté centrada en OpenAI, tu equipo quiera las características directas de GPT Image y se confirmen la verificación de la cuenta actual y el estado de la ruta. Es especialmente atractivo cuando tu modelo de costos ya espera la contabilidad de OpenAI basada en tokens y cuando necesitas el comportamiento de la herramienta de imagen de la API de Image o la API de Responses.

Elige una ruta de Google Nano Banana cuando tu plan de Imagen existente sea en realidad un plan de generación de imágenes de Google y quieras evitar el cierre de Imagen. Revisa la lista de modelos y la página de precios actuales de Nano Banana porque Google ahora divide las opciones de generación de imágenes en varios modelos de imagen Gemini, cada uno con diferente calidad, latencia, fundamentación, resolución y comportamiento de precios.

Mantén Imagen solo cuando ya dependas del comportamiento específico de Imagen y tengas un plan de migración corto y con fecha. La advertencia de Google convierte a Imagen en una excepción temporal, no en una nueva integración por defecto.

Usa Flatkey cuando tu problema real sea operar muchas cuentas de proveedores, claves, unidades de precios, registros de solicitudes y decisiones de ruta. Flatkey es más fuerte después de que se verifica la fila del modelo y el comportamiento de la ruta coincide con tu carga de trabajo. Después de que la comprobación de estado sea exitosa, obtén una clave y mantén la primera prueba de GPT Image vs Imagen API lo suficientemente acotada como para que los fallos sean fáciles de explicar.

Preguntas frecuentes

¿Es GPT Image vs Imagen API principalmente una comparación de calidad?

No. La calidad importa, pero los equipos de producción deben comparar la forma del endpoint, la unidad de precios, los valores predeterminados de recuento de salidas, los controles de seguridad, el riesgo de obsolescencia, los registros y la disponibilidad de la ruta. Una hermosa imagen de muestra no es evidencia suficiente para el lanzamiento.

¿Está obsoleta la API de Imagen?

La guía actual de Imagen de Google dice que los modelos de Imagen están obsoletos y se cerrarán el 17 de agosto de 2026. La guía recomienda migrar a Nano Banana para la generación de imágenes.

¿Cómo se tarifica GPT Image?

La guía de GPT Image de OpenAI estima el costo a partir de los tokens de texto de entrada, los tokens de imagen de entrada para flujos de trabajo de edición/referencia y los tokens de salida de imagen. El tamaño, la calidad y las imágenes parciales pueden cambiar la estimación, así que utiliza la página de precios y la calculadora actuales de OpenAI antes de presupuestar.

¿Cómo se tarifica Imagen 4?

La página de precios de Google lista Imagen 4 Fast, Standard y Ultra con precios por imagen de nivel de pago. Debido a que esos modelos están obsoletos, las nuevas comparaciones también deberían verificar los precios y los plazos de migración de Nano Banana.

¿Puede Flatkey enrutar tanto GPT Image como los modelos de imagen de Google?

La superficie de producto pública de Flatkey admite el acceso unificado a modelos, la revisión de precios y múltiples familias de endpoints, pero la disponibilidad de la ruta es específica del modelo. En la instantánea del 5 de julio de 2026 para este artículo, algunas filas de imágenes de Google estaban disponibles, mientras que gpt-image-2 estaba marcado como official_unsupported. Siempre vuelve a verificar el catálogo actual y ejecuta una prueba de humo.

¿Qué debería probar primero a través de Flatkey?

Comienza con una imagen, una instrucción, un tamaño explícito, una calidad o preajuste de modelo explícito y una clave de propietario. Luego, verifica el registro de solicitudes, el estado de la ruta, los campos de uso y la revisión de costos antes de agregar solicitudes de varias imágenes o tráfico de producción.