Model and Modality Playbooks24 июня 2026 г.Big Y

Руководство по каталогу AI-моделей: как читать провайдеров, эндпоинты, группы и цены

Используйте это руководство по каталогу AI-моделей, чтобы перед запуском в продакшен проверять провайдеров, эндпоинты, группы, статусы доступности, единицы тарификации и маршруты.

Руководство по каталогу AI-моделей: как читать провайдеров, эндпоинты, группы и цены

Каталог AI-моделей полезен только тогда, когда помогает команде принять продакшен-решение. Страницы, заполненной названиями моделей, недостаточно. Разработчикам нужно знать, какому провайдеру принадлежит модель, к какому семейству эндпоинтов будет обращаться приложение, какая группа или уровень маршрута будет обслуживать трафик, доступна ли строка сейчас и как измеряется цена, прежде чем через нее пройдет первый реальный пользовательский запрос.

Это руководство по каталогу AI-моделей было проверено 24 июня 2026 года по публичным страницам Flatkey, актуальному pricing API Flatkey, сохраненному исследованию Ahrefs и официальной документации по каталогам моделей от Microsoft, Google, Vercel и OpenAI. Рассматривайте каждое количество в каталоге, статус, семейство эндпоинтов и поле цены как снимок на конкретный момент времени. Перед продакшен-трафиком снова откройте цены Flatkey, подтвердите точную строку модели и выполните низкорисковый тест маршрута.

Практическая цель проста: превратить просмотр моделей в повторяемую проверку. Если ваша команда может прочитать провайдера, эндпоинт, группу, статус, цену и владельца из одной записи каталога AI-моделей, решение по модели становится проще согласовать с инженерией, финансами, поддержкой и закупками.

Краткий ответ: как читать каталог AI-моделей

Читайте каталог AI-моделей слева направо: сначала провайдер, затем эндпоинт, группа, статус, цена и в конце тест маршрута. Такой порядок не дает командам выбрать привлекательное название модели, которую нельзя безопасно вызывать через эндпоинт, группу или бюджетную политику, фактически используемую приложением.

Поле каталога Что оно показывает Какое решение принять Проверка Flatkey
Провайдер Кто предоставляет или хостит маршрут модели. Может ли этот провайдер соответствовать вашим ожиданиям по функциям, рискам и поддержке? Подтвердите запись поставщика и любые примечания к строке, специфичные для провайдера.
ID модели Точная строка, которую будет запрашивать ваше приложение. Может ли приложение использовать этот ID без расхождения алиасов или устаревшей документации? Копируйте строку модели из /pricing, а не по памяти.
Семейство эндпоинтов Форма протокола: chat, responses, генерация изображений, видео, Gemini, Anthropic или другой маршрут. Подходят ли текущий SDK, тело запроса, режим streaming и парсер ответа? Проверьте поддерживаемое семейство эндпоинтов перед изменением base URL.
Группа Уровень маршрута или пул ресурсов, обслуживающий запрос. Какая группа должна обрабатывать staging, production, fallback или чувствительный к стоимости трафик? Перед запуском сравните точную метку группы и коэффициент группы.
Статус Показывает, является ли последняя проверка каталога чистой, неподдерживаемой или нерешенной. Должна ли эта строка получать продакшен-трафик, smoke test или не получать трафик? Не считайте видимую строку доступной, пока статус и тестовый запрос не совпадут.
Единица тарификации Как начисляется плата за использование: input, output, cache, image, video, second или фиксированная job-style единица. Какую бюджетную формулу и квоту нужно применить? Проверяйте token-style поля и нетокеновые ценовые поля отдельно.
Тест маршрута Работает ли модель для точного пути функции. Могут ли инженерия, финансы и поддержка принять результат? Выполните staging-запрос, затем проверьте использование, стоимость, статус и логи.

Текущий снимок каталога AI-моделей Flatkey

Актуальный снимок pricing API Flatkey, использованный для этой статьи, вернул success: true 24 июня 2026 года. Он содержал 637 строк каталога, 23 записи поставщиков, пять используемых меток групп и шесть семейств эндпоинтов. Верхнеуровневая версия цен в ответе была a42d372ccf0b5dd13ecf71203521f9d2.

Поле снимка Значение на 24 июня 2026 года Как использовать
Всего строк каталога 637 Используйте каталог AI-моделей как источник на уровне строк, а не как статичный список провайдеров.
Записи поставщиков 23 Идентичность провайдера важна для поддержки, compliance и решений по fallback.
Семейства эндпоинтов openai, gemini, image-generation, anthropic, openai-response, openai-video Семейство эндпоинтов показывает, может ли текущий формат запроса работать.
Статусы доступности available, official_unsupported, unknown_failure Статус должен управлять gating трафика и приоритетом smoke tests.
Доступные строки 132 Все равно требуют теста маршрута для вашего эндпоинта, группы, промпта и квоты.
Официально неподдерживаемые строки 37 Не используйте их в продакшене без более нового подтвержденного статуса.
Строки с неизвестной ошибкой 468 Считайте их нерешенными, пока не проверены данные по маршруту, аккаунту, upstream или статусу.

Публичная главная страница Flatkey позиционирует продукт вокруг одного API key, OpenAI-compatible base URL https://router.flatkey.ai/v1, прозрачных цен, единого биллинга и одной dashboard для keys, usage и routing. Эти заявления делают каталог AI-моделей операционно полезным, но не отменяют необходимости проверять конкретную строку, которую будет вызывать ваш продукт.

Читайте провайдеров до названий моделей

Названия моделей переходят между поставщиками, gateways, документацией и алиасами. Идентичность провайдера — первое стабилизирующее поле. Оно показывает, кто предоставляет маршрут модели, какой аккаунт или upstream может быть задействован, откуда берутся ожидания по поддержке и должна ли модель находиться в прямом плане провайдера, gateway route или ограниченном evaluation path.

Официальные cloud-каталоги относятся к той же проблеме серьезно. Microsoft Foundry Models отделяет модели, продаваемые Azure, от партнерских и community models и рекомендует клиентам изучать описания моделей, model cards, документацию и юридические условия перед выбором модели. Google Model Garden позволяет командам фильтровать по коллекциям моделей и провайдерам, а затем открывать model cards для подробностей. Урок для любого каталога AI-моделей тот же: провайдер — не декоративное поле, а часть операционного контракта.

Для оценки Flatkey запишите:

  • Провайдер или поставщик: запись поставщика, связанная со строкой.
  • Строка модели: точный model ID, видимый в ценах Flatkey.
  • Владелец: команда, функция, клиент или владелец бюджета, запрашивающий модель.
  • Причина выбора: качество, стоимость, задержка, модальность, контекст, tool use, изображение, видео или fallback behavior.
  • Маршрут замены: что должно использовать приложение, если у строки провайдера изменится статус.

Читайте эндпоинты как контракты, а не как метки

Семейство эндпоинтов сообщает приложению, какую форму запроса и ответа ожидать. Модель, указанная в семействе эндпоинтов openai, может подходить для OpenAI-compatible SDK flow. Модель в anthropic, gemini, image-generation, openai-response или openai-video может требовать другого тела запроса, парсера, поведения streaming, пути обработки файлов или интерпретации usage.

Поэтому полезный каталог AI-моделей нужно читать вместе с планом миграции. Если ваше приложение уже использует OpenAI-compatible client, начните с workflow миграции OpenAI-compatible API: измените base URL в staging, сохраните model ID явным, выполните небольшой запрос, проверьте ответ, затем изучите логи и стоимость. Не предполагайте, что каждая строка модели поддерживает каждый стиль эндпоинта.

Семейство эндпоинтов Что проверить Типичный режим отказа
openai Base URL, model ID, формат messages, streaming, tool calls, JSON mode, usage fields. SDK-вызов синтаксически успешен, но использует строку модели, которая не поддерживает функцию.
openai-response Тело запроса в стиле Responses, парсинг output, поведение tools, multimodal input. Предположения chat-completions переносятся в workflow в стиле Responses.
anthropic Форма запроса messages, обработка system prompt, поведение image input, usage fields. Тело в стиле OpenAI отправляется в маршрут в стиле Anthropic без адаптации.
gemini Форма запроса Gemini, multimodal input, safety settings, парсинг ответа. При выборе модели игнорируются различия функций или ответов, специфичные для провайдера.
image-generation Правила input image, output size, quality, moderation, format и допустимое количество результатов. Бюджетирование по числу запросов скрывает затраты на качество изображений и повторы.
openai-video Duration, aspect, async job state, polling, обработка ошибок и usage unit. Video jobs рассматриваются как дешевые синхронные текстовые вызовы.

Читайте группы как политику маршрута и стоимости

В едином gateway группа — это не просто метка. Она может представлять уровень маршрута, пул ресурсов, путь аккаунта или ценовую политику. Снимок Flatkey от 24 июня показал используемые метки групп, включая Economy, Standard, Claude Economy, Claude Official и Seedance2.0 Official. Ответ также включал описания групп и коэффициенты групп.

При чтении каталога AI-моделей группы отвечают на вопросы, на которые название модели ответить не может:

  • Какую группу должен использовать staging? Для интеграционных тестов может быть достаточно низкорискового маршрута.
  • Какую группу должен использовать production? Продакшену может потребоваться другой путь провайдера, профиль стоимости или ожидание по поддержке.
  • Какую группу должен использовать fallback? Fallback route должен соответствовать требованиям к качеству, задержке и бюджету.
  • Какую группу должны проверить финансы? Коэффициенты на уровне групп могут изменить эффективную стоимость для одного и того же названия модели.
  • Какую группу должны одобрить закупки? Прямой или официальный маршрут может требовать иных доказательств, чем economy route.

Безопасная привычка — фиксировать группу в решении по модели, а не только model ID. Строка модели, которая выглядела разумной в одной группе, может иметь другую стоимость или операционный путь в другой группе.

Читайте цены по единицам до сравнения строк

Ценовые поля легко неверно прочитать, потому что разные семейства моделей показывают разные единицы. Текстовые модели часто разделяют input, cached input и output. Строки изображений и видео могут добавлять настройки качества, единицы сгенерированных медиа, duration jobs или фиксированные поля в стиле model-price. Публичная страница цен OpenAI, например, разделяет цены input, cached input и output за 1M tokens для своих моделей. Google Model Garden отмечает, что использование open source model может включать расходы на tuning и deployment compute. Microsoft Foundry отмечает, что serverless deployments обычно тарифицируются за API inputs и outputs, часто в токенах, тогда как managed compute использует virtual machine core hours.

Для проверки каталога AI-моделей Flatkey разделяйте ценовые формы перед сравнением строк:

Ценовая форма Поля для проверки Бюджетный вопрос
Token-style text model_ratio, completion_ratio, cache_ratio Будет ли функция тратить больше на prompts, outputs, cached context или retries?
Multimodal chat Семейство эндпоинтов, input tokens, output tokens, image/video inputs, cache behavior. Меняют ли нетекстовые inputs эффективную стоимость?
Генерация изображений Строка модели, семейство эндпоинтов, output settings, retry count, accepted image count. Сколько стоит одно принятое изображение после failures и edits?
Генерация видео Строка модели, duration, quality, job state, retry policy, model_price, если присутствует. Может ли quota остановить дорогие jobs до бюджетного инцидента?
Group-adjusted route Метка группы, коэффициент группы, production route, fallback route. Сравнивает ли команда ту группу, которую фактически будет использовать?

Для более глубокого cost workflow используйте руководство по сравнению цен AI-моделей после того, как сформируете shortlist строк. Это руководство по каталогу AI-моделей помогает решить, какие строки вообще заслуживают ценового анализа.

Проверяйте статус перед продакшен-трафиком

Видимая строка каталога — не то же самое, что production-ready route. В снимке Flatkey от 24 июня только 132 из 637 строк имели available как последний статус доступности. Оставшиеся строки были разделены между official_unsupported и unknown_failure. Это не означает, что каждая нерешенная строка навсегда непригодна; это означает, что строке нужны актуальные данные по маршруту, прежде чем она будет обслуживать пользовательский трафик.

Используйте статус как gate:

  1. Available: выполните staging smoke test для вашего точного эндпоинта, группы, тела запроса и формы промпта.
  2. Official unsupported: не запускайте продакшен-трафик, если более новый источник не доказывает, что статус изменился.
  3. Unknown failure: выясните, связана ли проблема со статусом upstream, разрешением аккаунта, конфигурацией маршрута, регионом, квотой или transient failure.
  4. Нет ясного статуса: считайте строку неутвержденной, пока dashboard или API test не создаст доказательства.
  5. Статус изменился: обновите запись решения по модели и уведомите владельца перед перенаправлением пользователей.

Поле статуса — это также финансовый контроль. Fallback route, который незаметно переходит с чистой недорогой строки на нерешенную или более дорогую строку, может превратить model experiment в incident. Держите статус, группу и цену вместе в каждой проверке каталога AI-моделей.

Workflow Flatkey для проверки каталога

Используйте этот workflow, когда команда просит добавить или изменить модель за одним ключом.

  1. Откройте текущий каталог: начните с цен Flatkey и скопируйте точную строку.
  2. Зафиксируйте провайдера и группу: не утверждайте строку только по названию модели.
  3. Подтвердите семейство эндпоинтов: сопоставьте маршрут с вашим SDK, телом запроса, планом streaming и парсером.
  4. Проверьте статус: направляйте продакшен-трафик только после совпадения статуса и live request.
  5. Классифицируйте единицу тарификации: token, cache, image, video, duration, fixed price или group-adjusted route.
  6. Выполните низкорисковый тест: отправьте staging request через https://router.flatkey.ai/v1 или соответствующее семейство маршрутов.
  7. Проверьте использование и стоимость: изучите dashboard на предмет model, usage, cost, status и routing evidence.
  8. Задайте квоту и владельца: свяжите строку с key, budget owner, limit, alert и rollback route.
  9. Сохраните решение: держите вместе строку каталога, дату, статус, группу, ценовые поля, результат теста и signoff владельца.

Это также чистая передача между инженерией и финансами. Инженерия доказывает, что маршрут работает. Финансы доказывают, что единица и владелец имеют смысл. Поддержка доказывает, что решение по модели можно объяснить, когда клиент спросит, почему функция изменилась.

Шаблон: запись проверки каталога AI-моделей

Ведите компактную запись для каждой строки модели, которая доходит до staging или production. Это превращает просмотр каталога AI-моделей в операционную привычку.

Запись проверки каталога AI-моделей
Дата проверки:
Запросивший:
Функция или workflow:
Среда: development / staging / production / batch / customer-facing

Строка модели:
Провайдер или поставщик:
Семейство эндпоинтов:
Группа:
Статус доступности:
Ценовые поля:
Ожидаемая единица: input tokens / output tokens / cached input / image / video / duration / fixed job

Тест маршрута:
Путь запроса:
SDK или клиент:
Ответ принят: yes / no
Использование видно: yes / no
Стоимость видна: yes / no
Квота подключена: yes / no

Владелец:
Владелец бюджета:
Владелец поддержки:
Fallback route:
Условие rollback:
Дата следующей проверки:

Типичные ошибки в каталогах AI-моделей

Ошибка Почему это создает риск Более правильная проверка
Выбор только по названию модели Алиасы, провайдеры, семейства эндпоинтов и группы могут различаться. Утверждайте точную строку: провайдер, эндпоинт, группа, статус, цена, владелец.
Предположение, что OpenAI-compatible означает работу всех функций Tool use, streaming, images, video и response formats могут различаться в зависимости от маршрута. Выполните smoke test на уровне функции перед запуском.
Игнорирование меток групп Одно и то же название модели может иметь разную стоимость или поведение маршрута в разных группах. Зафиксируйте production group и сравните group ratios.
Отношение к нерешенному статусу как к безвредному Unknown failures могут скрывать проблемы маршрута, разрешений, upstream или аккаунта. Блокируйте трафик, пока статус и данные запроса не будут чистыми.
Сравнение цен без единиц Input tokens, output tokens, cached tokens, images и video jobs бюджетируются по-разному. Классифицируйте единицу тарификации перед использованием сравнительной таблицы.

Когда единый каталог AI-моделей помогает больше всего

Единый каталог AI-моделей помогает больше всего, когда ваш продукт уже охватывает более одного провайдера, модальности или операционного владельца. Single-provider prototype часто может начать с одной страницы официальной документации. Production AI product обычно требует более устойчивого представления: GPT, Claude, Gemini, DeepSeek, Qwen, модели изображений, модели видео, routing groups, status, quotas, usage и cost в одном review loop.

Flatkey разработан для команд, которым нужны один API key, один compatible base URL, единые pricing and billing и одна dashboard для keys, usage и routing. Проверка каталога — это место, где эта ценность становится конкретной. Вы можете сравнить строки, выбрать маршрут, протестировать эндпоинт, подключить quota и хранить usage evidence в одном операционном пути вместо того, чтобы распределять решение по порталам провайдеров и spreadsheets.

Правильный следующий шаг — не доверять строке вслепую. Начните с текущей страницы цен моделей, скопируйте точную модель и группу, протестируйте маршрут в staging, затем получите ключ, когда будете готовы оценить workflow в собственном приложении.

FAQ

Что такое каталог AI-моделей?

Каталог AI-моделей — это searchable list строк моделей с достаточным контекстом, чтобы выбрать, протестировать и эксплуатировать модель. Полезный каталог должен показывать провайдера, model ID, семейство эндпоинтов, группу или уровень маршрута, статус доступности, единицу тарификации и документацию или dashboard evidence.

Почему провайдер важен в каталоге AI-моделей?

Идентичность провайдера показывает, кто предоставляет или хостит маршрут, какие условия и ожидания по поддержке могут применяться и какая проверка fallback или procurement нужна. Одного названия модели недостаточно для продакшен-одобрения.

Как сравнивать семейства эндпоинтов?

Сравнивайте семейства эндпоинтов по форме запроса, совместимости SDK, поведению streaming, поддержке tools, multimodal input, парсингу ответа и usage fields. Строка, работающая для chat, может не работать для image, video, Gemini, Anthropic или запросов в стиле Responses.

Что такое группа модели?

Группа модели — это метка маршрута или ресурса, которая может влиять на стоимость, upstream path, ожидания по поддержке или fallback behavior. В Flatkey читайте группу вместе с model ID и ценовыми полями перед утверждением маршрута.

Как часто командам нужно перепроверять каталог AI-моделей?

Перепроверяйте перед каждым продакшен-запуском, заменой модели, изменением fallback, крупной проверкой цен или разбором incident. Каталоги AI-моделей быстро меняются, поэтому датированные снимки не следует считать постоянными гарантиями доступности или цен.

Финальный шаг проверки каталога

Перед тем как строка модели попадет в продакшен, назначьте владельца для каждого поля в записи каталога AI-моделей. Инженерия отвечает за соответствие эндпоинта и тестирование маршрута. Финансы отвечают за единицу цены и бюджет. Поддержка отвечает за customer-facing impact. Платформа отвечает за quota, fallback и rollback. Так каталог становится инфраструктурой, а не меню моделей.

Чтобы выполнить версию проверки Flatkey, откройте цены Flatkey, выберите строку модели, подтвердите провайдера, эндпоинт, группу, статус и единицу цены, затем получите ключ и протестируйте маршрут перед масштабированием трафика.