Model and Modality Playbooks2026年6月24日Big Y

GPT Image vs Gemini Image API：选择前需要确认的路由和价格问题

使用这份 GPT Image vs Gemini Image API 清单，对比路由、计价单位、Flatkey 目录状态、日志、配额和生产检查。

GPT Image vs Gemini Image API 不是一个简单的模型质量问题。对生产团队来说，更难的选择通常在于路由、计价单位、编辑工作流，以及第一批图像运行后你能向财务或采购提供的证据。

本指南于 June 24, 2026 核查。它使用了当前官方 OpenAI 图像生成文档、Google Gemini 图像生成和价格文档，以及一份实时 Flatkey 公开价格页快照。请将每一行模型和价格都视为某一时间点的规划输入，然后在生产流量上线前核查当前提供商页面、Flatkey 价格行、路由状态、仪表板日志，并进行真实的冒烟测试。

Flatkey 在这项对比中的角色是运营层面的：一个密钥、模型访问、路由、计费、用量分析，以及价格/目录界面。本文并不声称每一条列出的图像路由目前都可以通过 Flatkey 用于生产。本文使用的 Flatkey 公开目录快照显示，部分 Gemini 图像行标记为可用，而 GPT Image 或 Imagen 行需要进行路由状态复核。

快速结论：GPT Image vs Gemini Image API

当买方已经不再停留在“这个模型能不能生成图像？”这个问题上，而是需要知道哪条 API 路径能够被路由、定价、监控并干净地回滚时，可以使用这份 GPT Image vs Gemini Image API 清单。

决策点	GPT Image API 路径	Gemini Image API 路径	Flatkey 检查项
主要 API 形态	OpenAI 文档说明，图像生成既可以通过 Images API 使用，也可以作为 Responses API 内的图像生成工具使用。	Google 在 Gemini API 下记录了 Gemini 原生图像生成，包括 Nano Banana 和 Nano Banana Pro 模型系列。	确认目标路由使用的是 OpenAI 兼容图像生成、Gemini 原生调用，还是其他端点系列。
模型选择	Images API 调用会直接选择一个 GPT Image 模型。Responses API 调用会选择一个可调用图像生成工具的主线模型。	Google 在其图像生成文档中将 Nano Banana Pro 映射到 Gemini 3 Pro Image，将 Nano Banana 映射到 Gemini 2.5 Flash Image。	上线前检查准确的 Flatkey 模型 ID、供应商行、端点类型、分组和可用性状态。
计价单位	OpenAI 将 GPT Image 成本表述为输入文本 token、用于编辑/参考工作流的输入图像 token，以及图像输出 token。	Google 按 token 单位列出 Gemini 图像价格，并为 Gemini 3 Pro Image 和 Gemini 2.5 Flash Image 提供等效的按图像示例。	将所有提供商单位统一换算为每张最终验收图像的成本，而不只是每次请求的成本。
路由风险	需要直接验证路由状态、图像端点支持、审核行为和输出格式处理。	Gemini 图像行可能会根据具体行使用 Gemini 原生和 OpenAI 兼容端点类型。	先做一次单图像冒烟测试，然后检查日志、计费单位、状态、重试行为和回滚路径。

OpenAI 当前 GPT Image 文档确认了什么

OpenAI 的图像生成指南说明，GPT Image 模型，包括 gpt-image-2，可以根据文本提示生成和编辑图像。该指南还区分了直接的 Images API 与 Responses API 图像生成工具。

这一区分对 GPT Image vs Gemini Image API 路由很重要。如果你的应用只需要根据提示一次性生成图像，OpenAI 将 Images API 定位为更简单的路径。如果你的产品需要对话式图像生成、多轮编辑，或需要让图像输入保留在上下文中，那么 Responses API 路径就是另一项设计选择，并且会产生额外的主线模型 token 用量。

在价格方面，OpenAI 的指南表示，GPT Image 请求成本由输入文本 token、编辑或使用参考图像时的输入图像 token，以及图像输出 token 相加得到。该指南还引导读者查看当前价格页面，并包含 gpt-image-2 的输出成本示例。在本文的来源核查中，OpenAI 的示例表列出 gpt-image-2 1024 x 1024 输出的价格为：低质量 $0.006、中等质量 $0.053、高质量 $0.211。这些是需要核查的示例，不是永久采购价格。

OpenAI 还记录了应纳入路由清单的实际实现约束：图像生成可以流式传输部分图像，部分图像会增加输出 token，gpt-image-2 目前不支持透明背景，并且图像生成错误应通过检查 HTTP 状态、请求 ID 和稳定错误代码来处理，例如审核拦截。

Google 的 Gemini 图像文档确认了什么

Google 的 Gemini API 图像生成指南目前将原生图像生成表述为 Nano Banana。该指南将 Nano Banana Pro 映射到 Gemini 3 Pro Image，将 Nano Banana 映射到 Gemini 2.5 Flash Image。这种命名差异正是 GPT Image vs Gemini Image API 评估应记录模型别名，而不只是记录提供商品牌的原因之一。

Google 的 Gemini API 价格页面列出了图像专用价格行。在本文的来源核查中，Gemini 3 Pro Image 列出的图像输入价格为每 1M tokens $2.00，等效于每张图像 $0.0011；图像输出价格为每 1M tokens $120。Google 还列出 1K 和 2K 输出图像为 1120 tokens，等效于每张图像 $0.134；4K 输出图像为 2000 tokens，等效于每张图像 $0.24。

对于 Gemini 2.5 Flash Image，Google 的价格页面列出的标准输出价格为每张图像 $0.039，batch 和 flex 行为每张图像 $0.0195，thinking 行为每张图像 $0.0702。同一页面还说明，图像输出按每 1M tokens $30 计价，最高 1024 x 1024 的输出图像消耗 1290 tokens。

Google 的页面也关系到弃用风险。该页面警告 Imagen 4 模型已弃用，并计划在 August 17, 2026 关闭，同时指引迁移到 Gemini 2.5 Flash Image。如果目录行或旧工作流仍引用 Imagen 4，在没有迁移说明的情况下，不要将其视为中性的替代选项。

GPT Image vs Gemini Image API 路由问题

有用的 GPT Image vs Gemini Image API 决策是一份清单，而不是一个胜负标签。在路由真实用户流量之前，请先问这些问题。

问题	它为什么会改变选择	需要记录什么
应用会调用哪个端点系列？	OpenAI Images API、OpenAI Responses 图像工具、Gemini 原生生成，以及网关图像生成路由，并不暴露完全相同的请求和响应形态。	Base URL、端点路径、模型 ID、SDK 方法、响应图像格式，以及代码片段是否实际测试过。
这条路由今天可用吗？	公开目录行并不等同于成功路由。Flatkey 的 June 24 公开价格快照显示有 634 个模型、23 家提供商和 68 个图像相关行，但不同条目的可用性状态并不相同。	Flatkey 目录状态、分组、端点类型、提供商行、请求 ID，以及一次单图像冒烟测试结果。
计价单位是什么？	OpenAI 的 GPT Image 流程基于提示文本、输入图像和输出图像 token 计价。Google 为 Gemini 图像模型公开 token 行和按图像等效价格。	每次生成尝试的成本、每张验收图像的成本、重试率、参考图像输入，以及部分输出是否计费。
什么算作一次编辑？	参考图像、遮罩和多轮编辑可能改变输入 token 用量、延迟和失败行为。	参考图像的数量和大小、遮罩处理、保留要求，以及输出被拒率。
如何处理被拦截的提示？	图像审核和提供商安全策略可能拦截输入或输出。在不改变请求的情况下重试可能浪费成本。	错误代码、可用时的审核阶段、面向用户的文案、支持流程，以及安全的提示修订指导。
财务如何审计支出？	静态提供商示例无法回答是哪个团队、密钥、路由或模型产生了成本。	Flatkey 用量日志、密钥归属、模型行、计费单位、配额影响，以及与提供商当前价格页面的对账。

GPT Image vs Gemini Image API 的计价单位清单

一份 GPT Image vs Gemini Image API 价格工作表应避免只有一个“每张图像价格”单元格，除非你先定义工作流。

统一换算 GPT Image

对于 GPT Image，使用以下工作表结构：

提示文本：图像请求的文本输入 token。
参考图像：编辑或使用输入图像进行锚定时的图像输入 token。
输出图像：由质量和尺寸决定的图像输出 token。
部分图像：如果请求流式部分图像，则会产生额外输出 token。
验收率：被拒绝或重新生成的图像应计入每个可用资产的成本。

统一换算 Gemini Image

对于 Gemini 图像模型，请写下模型系列和计价模式。Gemini 3 Pro Image 和 Gemini 2.5 Flash Image 的单位示例并不相同。在 Google 价格快照中，Gemini 3 Pro Image 的图像输出示例更高，而 Gemini 2.5 Flash Image 列出了较低的标准按图像输出行。如果你的工作流使用高分辨率输出、thinking mode，或 batch/flex 处理，请将这些作为单独的行保留。

统一换算 Flatkey 行

对于 Flatkey，价格页面是当前公开事实来源。在 June 24, 2026，服务器渲染的价格页面描述了 23 家提供商的 634 个 AI 模型。提取出的端点系列包括 image-generation、gemini、openai、openai-response 和 openai-video。同一次提取发现了 68 个图像相关行，以及 16 个选定的 GPT Image、Gemini image 或 Imagen 行。

关键的运营细节是：选定的 Gemini 图像行，例如 gemini-2.5-flash-image、gemini-2.5-flash-image-preview、gemini-3-pro-image-preview 和 gemini-3.1-flash-image-preview，在公开目录提取中标记为可用。选定的 GPT Image 和 Imagen 行，包括 openai/gpt-image-2 和 Imagen 4 行，显示 unknown_failure。请将其作为核查路由状态的理由，而不是永久支持结论。

Flatkey 对 GPT Image vs Gemini Image API 的验证路径

在 GPT Image vs Gemini Image API 评审中，Flatkey 的特定价值在于一条清晰的运营路径：一个密钥、当前模型行、路由检查、计费可见性，以及供采购使用的内部证据。

打开公开价格页面：从 Flatkey 价格页开始，搜索准确的图像模型 ID，而不是只搜索提供商名称。
检查端点类型：确认该行暴露的是 image-generation、openai、openai-response、gemini，还是多个端点系列。
检查路由状态：对于需要调查且没有当前测试结果的行，不要将生产流量路由过去。
运行一个小请求：保存模型 ID、Base URL、端点路径、请求 ID、响应形态、如有错误则记录错误详情，以及计费单位。
检查日志和计费：确认请求出现在预期的密钥、团队、路由、模型和用量单位下。
定义回滚：决定当审核、提供商错误、输出质量或配额行为发生变化时该怎么处理。

如果团队还在迁移 SDK 或 Base URL，请使用 OpenAI 兼容 API 迁移：将 Base URL 改为 Flatkey 作为 Base URL 清单，然后回到本文检查图像专用的单位和路由。对于更广泛的成本建模，请使用 AI 模型价格对比和实时价格页面。

决策矩阵

如果你的优先事项是...	倾向选择...	但要验证...
通过 OpenAI 文档化的 Images API 直接控制 GPT Image 模型	GPT Image API	当前模型访问权限、组织验证、透明背景需求、流式传输成本，以及如果经过路由则验证 Flatkey 路由状态。
在更广泛的 OpenAI 响应流程中进行对话式或多轮图像工作流	OpenAI Responses API 图像生成工具	主线模型选择、图像工具支持、额外主线 token 用量，以及已存储对话行为。
Gemini 原生图像生成和 Google 当前 Gemini 图像行	Gemini Image API	Nano Banana 模型别名、Gemini 3 Pro Image 与 Gemini 2.5 Flash Image 价格、输出分辨率，以及从已弃用 Imagen 行迁移出来。
跨提供商的一键路由、团队计费、配额审查和路由证据	Flatkey 加一条已测试的模型路由	准确的 Flatkey 行状态、端点系列、请求日志、计费单位，以及生产前的回滚路由。

FAQ

GPT Image vs Gemini Image API 主要是质量对比吗？

不是。质量很重要，但生产买方还需要路由可用性、端点形态、输入图像处理、审核行为、计费单位、日志、配额和回滚证据。

我应该如何比较 GPT Image vs Gemini Image API 的价格？

统一换算为每张验收图像的成本。包括提示 token、参考图像输入、输出尺寸和质量、流式部分图像、重试、被拒结果，以及当前 Flatkey 价格行中显示的任何网关或路由专用单位。

我可以假设 Imagen 4 仍然是安全的 Gemini 图像备用方案吗？

不可以。为本文核查的 Google 价格页面称 Imagen 4 模型已弃用，并计划在 August 17, 2026 关闭。除非当前 Google 页面另有说明，否则应将 Imagen 4 视为迁移风险。

Flatkey 会让 GPT Image 和 Gemini Image API 的行为完全相同吗？

不会。网关可以集中访问、路由、计费和可见性，但提供商 API 仍然具有不同的端点、计价单位、限制、审核行为和模型可用性。在声称等效之前，请测试准确的行和端点。

在通过 Flatkey 发送生产图像流量之前，我应该做什么？

检查实时价格行，确认端点类型，运行小规模冒烟测试，查看日志和计费单位，设置配额，记录重试和被拦截提示的处理方式，并保留一个回滚模型或直接提供商路由。

最终结论

如果 GPT Image vs Gemini Image API 只停留在提供商名称层面，这个问题本身就问错了。实际问题是，哪条图像路由能为你的团队提供合适的 API 形态、当前模型状态、计价单位、安全行为和审计链路。使用 Flatkey 的实时价格目录检查候选行，然后在准备好测试一条带有日志和计费记录的真实单图像路由时获取密钥。