Model and Modality Playbooks22. Juni 2026Big Y

DeepSeek V4 Migrations-Checkliste: Veraltete Aliases sicher ersetzen

Nutzen Sie diese DeepSeek V4 Migrations-Checkliste, um deepseek-chat und deepseek-reasoner zu ersetzen, den Thinking-Modus zu testen, Flatkey-Routing zu prüfen und bei Bedarf sicher zurückzurollen.

DeepSeek V4 Migrations-Checkliste: Veraltete Aliases sicher ersetzen

DeepSeek V4-Migration ist jetzt eine deadline-getriebene Aufräumaufgabe und nicht nur ein Modell-Upgrade. In den offiziellen API-Dokumenten von DeepSeek heißt es, dass die älteren Aliase deepseek-chat und deepseek-reasoner nach dem 24. Juli 2026 um 15:59 UTC vollständig außer Betrieb genommen und nicht mehr zugänglich sein werden. Die unterstützten V4-Modell-IDs sind deepseek-v4-flash und deepseek-v4-pro.

Die gute Nachricht ist, dass dies für viele Teams eine kontrollierte Konfigurationsänderung sein sollte. DeepSeek empfiehlt, dieselbe direkte base_url beizubehalten und nur den Modellnamen zu aktualisieren. Wenn Sie Modelle über Flatkey weiterleiten, gilt dasselbe: Lassen Sie Ihre App weiterhin auf https://router.flatkey.ai/v1 zeigen, ersetzen Sie den Alias durch eine aktuelle Flatkey-DeepSeek-V4-Modellzeile und prüfen Sie das Antwortverhalten, den Thinking-Modus, Nutzungsprotokolle, Preise und das Rollback, bevor produktiver Traffic umgestellt wird.

Diese Checkliste zur DeepSeek V4-Migration gibt Ihnen die konkreten Schritte: alte Aliase zuordnen, deepseek-v4-flash oder deepseek-v4-pro wählen, Thinking- und Nicht-Thinking-Verhalten testen, die SDK-Konfiguration aktualisieren und einen ungeprüften Modellwechsel kurz vor dem Stichtag vermeiden.

Schnelle Antwort: Was ändert sich bei einer DeepSeek-V4-Migration?

Die dringende Änderung ist die Modellzeichenfolge. Lassen Sie Produktionscode, Umgebungsvariablen, Prompt-Router, Eval-Jobs oder Fallback-Richtlinien nicht fest auf deepseek-chat oder deepseek-reasoner codiert.

Altes Alias Aktuelles offizielles Verhalten Zu testendes Migrationsziel Zu überprüfendes Risiko
deepseek-chat Leitet derzeit in den Nicht-Denkmodus von deepseek-v4-flash um deepseek-v4-flash mit deaktiviertem Thinking, sofern Sie nicht absichtlich einen anderen V4-Modus wählen Ausgabestil, Latenz, Kosten, Parser-Kompatibilität und alle ignorierten Parameter
deepseek-reasoner Leitet derzeit in den Denkmodus von deepseek-v4-flash um deepseek-v4-flash oder deepseek-v4-pro mit explizit getesteten Thinking-Einstellungen reasoning_content, Token-Nutzung, Multi-Turn-Verarbeitung und SDK-Unterstützung
Claude-ähnliche Modellnamen in der DeepSeek-Anthropic-API DeepSeek ordnet Claude-Opus-Namen V4 Pro und Claude-Haiku/Sonnet-Namen V4 Flash zu Bevorzugen Sie explizite DeepSeek-V4-Modell-IDs, sofern Ihre Routing-Schicht dies zulässt Nicht unterstützte Anthropic-Felder, Unterstützung für Bild-/Dokumentinhalte und Verhalten bei Tool-Aufrufen

Für einen direkten DeepSeek-Aufruf bleibt die offizielle OpenAI-kompatible Base-URL https://api.deepseek.com. Für Flatkey bleibt die Router-Base-URL https://router.flatkey.ai/v1. In beiden Fällen sollte die DeepSeek-V4-Migration als Modell- und Verhaltensänderung getestet werden, nicht nur als Suchen-und-Ersetzen.

Warum die Alias-Deadline wichtig ist

Die V4-Vorschauseite von DeepSeek sagt, dass die API jetzt verfügbar ist, sowohl deepseek-v4-pro als auch deepseek-v4-flash unterstützen 1M Kontext sowie sowohl den Thinking- als auch den Non-Thinking-Modus, und die älteren Aliase werden nach dem 24. Juli 2026 um 15:59 UTC eingestellt. Das bedeutet, dass ein veralteter Alias nach dem Auslaufzeitraum von „funktioniert heute“ zu „hartem Fehler“ werden kann.

Die Schnellstarttabelle auf der Homepage führt außerdem deepseek-chat und deepseek-reasoner als Aliase auf, die am 2026/07/24 veraltet sein werden. Dort wird darauf hingewiesen, dass diese Aliase zur Kompatibilität den Non-Thinking- und Thinking-Modi von deepseek-v4-flash entsprechen.

Dieses Kompatibilitätsdetail ist nützlich, aber kein Grund zu warten. Eine saubere DeepSeek V4-Migration gibt Ihnen Zeit, Ausgaben zu vergleichen, Runbooks zu aktualisieren, Support-Teams zu schulen und sicherzustellen, dass Produktions-Dashboards vor der Deadline die neuen Modell-IDs anzeigen.

Direct DeepSeek versus Flatkey-Routing

Es gibt zwei gängige Migrationspfade.

Entscheidung Direkte DeepSeek API DeepSeek über Flatkey
Basis-URL https://api.deepseek.com https://router.flatkey.ai/v1
API-Schlüssel DeepSeek API-Schlüssel Flatkey API-Schlüssel
Modellauswahl Offizielle DeepSeek-Modell-ID Aktuelle Flatkey-DeepSeek-Modellzeile
Hauptvorteil Einrichtung direkt beim Anbieter Ein Schlüssel, ein Router, gemeinsame Nutzungsprotokolle, Kontingente und Abrechnungs-Transparenz über Anbieter hinweg
Produktionsprüfung DeepSeek-Antwort, Thinking-Modus, Preisgestaltung und Fehler Antwort, Routing-Status, ausgewählte Modellzeile, Nutzungsprotokoll, Preiseinheit, Kontingent und Rollback

Der öffentliche Produkttext von Flatkey positioniert die Plattform rund um einen API-Schlüssel, eine mit OpenAI kompatible Basis-URL, klare Preise, vereinheitlichte Abrechnung und ein Dashboard für Schlüssel, Nutzung und Routing. Für Teams, die bereits GPT-, Claude-, Gemini-, Qwen-, MiniMax- und DeepSeek-Traffic über ein Gateway leiten, ist eine DeepSeek-V4-Migration ein guter Zeitpunkt, um Modell-IDs und Logging über den gesamten Stack hinweg zu standardisieren.

Flatkey Catalog Check For DeepSeek V4

Für diesen Artikel habe ich am 16. Juni 2026 Flatkeys öffentliche Pricing-API geprüft. Der Snapshot lieferte insgesamt 638 Modellzeilen und 19 Zeilen mit DeepSeek-Namen. Er listete sowohl deepseek-v4-pro als auch deepseek-v4-flash in der Standard-Gruppe mit openai-Endpoint-Unterstützung auf.

Betrachten Sie das als datierten Katalognachweis, nicht als Zusage, dass Ihr Konto und Ihr Pfad bereit sind. Im selben Snapshot hatten beide V4-Zeilen den Verfügbarkeitsstatus unknown_failure, was bedeutet, dass die Verfügbarkeit in der aktuellen Flatkey-Preisansicht oder im Dashboard bestätigt werden sollte, bevor der reale Traffic von diesem Pfad abhängt. Eine sorgfältige DeepSeek-V4-Migration sollte am Tag des Wechsels einen Live-Smoke-Test und eine Prüfung der Nutzungsprotokolle umfassen.

DeepSeek V4-Migrations-Checkliste

Verwenden Sie diese Checkliste, bevor Sie Aliase in der Produktion ersetzen.

  1. Inventarisieren Sie jeden Alias. Durchsuchen Sie Anwendungscode, Umgebungsvariablen, Prompt-Router-Regeln, Eval-Konfigurationen, Hintergrundjobs, Notebooks, Dokus und Support-Runbooks nach deepseek-chat und deepseek-reasoner.
  2. Klassifizieren Sie jede Workload. Markieren Sie jede Route als Chat, Reasoning, Agent-Tool-Nutzung, strukturierte Ausgabe, langen Kontext, Batch-Eval oder nur-Fallback. Gehen Sie nicht davon aus, dass jede Route in denselben V4-Modus wechseln sollte.
  3. Wählen Sie das Zielmodell. Beginnen Sie mit deepseek-v4-flash, wenn Sie den möglichst nahen Ersatz für die aktuellen Aliase möchten. Evaluieren Sie deepseek-v4-pro, wenn die Workload stärkere Fähigkeiten benötigt und Sie nach dem Testen das Kosten- und Latenzprofil akzeptieren können.
  4. Machen Sie Thinking explizit. Testen Sie für das alte Verhalten von deepseek-chat den Nicht-Thinking-Modus. Testen Sie für das alte Verhalten von deepseek-reasoner den Thinking-Modus und bestätigen Sie, wie Ihr SDK reasoning_content behandelt.
  5. Halten Sie Modell-IDs in der Konfiguration. Legen Sie das Zielmodell in einer Umgebungsvariable oder Routing-Tabelle ab, nicht inline in der Anwendungslogik.
  6. Führen Sie gepaarte Ausgabetests aus. Vergleichen Sie Antworten des alten Alias mit neuen V4-Antworten auf repräsentativen Prompts, Parsern, JSON-Mode-Aufgaben, Tool-Aufrufen und Verweigerungs-/Fehlerfällen.
  7. Verifizieren Sie Streaming und Usage-Abrechnung. Prüfen Sie, ob die finale Usage dort erscheint, wo Ihr Billing- oder Observability-Code sie erwartet, insbesondere bei Streaming-Antworten.
  8. Prüfen Sie Kosten und Kontingente. Bestätigen Sie die Provider-Preise oder Flatkey-Preise und setzen Sie dann ein niedriges Kontingent oder Testbudget, bevor der Produktionsverkehr ansteigt.
  9. Protokollieren Sie die neue Modell-ID. Stellen Sie sicher, dass Traces, Alerts und Billing-Exporte deepseek-v4-flash oder deepseek-v4-pro anzeigen und nicht nur ein generisches Provider-Label.
  10. Bereiten Sie ein Rollback vor. Behalten Sie einen früheren Provider oder ein Fallback-Modell konfiguriert, bis die V4-Route reale Workload-Tests bestanden hat.
  11. Entfernen Sie veraltete Dokus. Aktualisieren Sie interne Einrichtungsanleitungen, damit neue Entwickler keine veralteten Aliase zurück in die Produktion kopieren.

Konfigurationstemplate für Flatkey

Nur Vorlage: Führen Sie dies mit einem gültigen Flatkey-Schlüssel und einer bestätigten Flatkey DeepSeek V4-Modell-ID aus dem aktuellen Katalog aus. Die Struktur ist gewöhnliche OpenAI-SDK-Nutzung, aber Route, Modellstatus, Thinking-Verhalten und Nutzungsprotokoll müssen trotzdem getestet werden.

FLATKEY_API_KEY="sk-fk-your-key"
OPENAI_BASE_URL="https://router.flatkey.ai/v1"
FLATKEY_DEEPSEEK_MODEL="deepseek-v4-flash"

# Ziel während der Einführung leicht änderbar halten.
# Für den direkten DeepSeek-Vergleich:
DEEPSEEK_BASE_URL="https://api.deepseek.com"
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["FLATKEY_API_KEY"],
    base_url=os.environ.get("OPENAI_BASE_URL", "https://router.flatkey.ai/v1"),
)

response = client.chat.completions.create(
    model=os.environ.get("FLATKEY_DEEPSEEK_MODEL", "deepseek-v4-flash"),
    messages=[
        {
            "role": "user",
            "content": "Antworten Sie mit einem Satz und bestätigen Sie, dass die DeepSeek-V4-Route konfiguriert ist.",
        }
    ],
)

print(response.choices[0].message.content)
print(response.usage)

Für direktes DeepSeek-Testing folgen Sie den offiziellen OpenAI-SDK-Beispielen von DeepSeek für den Thinking-Modus. Der Thinking-Guide sagt, dass der Thinking-Schalter standardmäßig aktiviert ist, der Effort-Parameter im OpenAI-Format high und max unterstützt und niedrigere Effort-Bezeichnungen aus Kompatibilitätsgründen nach oben gemappt werden. Wenn Ihre App von Antworten ohne Thinking abhängt, treffen Sie diese Entscheidung explizit und testen Sie sie, statt sich auf einen Alias zu verlassen.

Testmatrix vor dem Cutover

Eine DeepSeek V4-Migration sollte erst freigegeben werden, nachdem Sie das Verhalten getestet haben, das Ihr Produkt tatsächlich verwendet.

Test Was zu prüfen ist Erfolgsindikator
Basis-Chat Einfacher Prompt, Antwortstruktur, Parser-Verhalten Die App erhält erwarteten Inhalt ohne Schema- oder Rollenfehler
Thinking-Modus thinking, reasoning_effort und reasoning_content Reasoning-Ausgabe wird gemäß Ihrer Produktpolicy verarbeitet oder absichtlich unterdrückt
Streaming Chunk-Format, finale Nutzung, Timeout-Verhalten Client-Parser und Billing-Hooks funktionieren weiterhin
Tool-Aufrufe Tool-Schema, Argumente, mehrstufige Agenten-Turns Tool-Aufrufe werden erzeugt und verarbeitet, ohne fehlerhaftes JSON oder fehlende IDs
Strukturierte Ausgabe JSON-Mode-Prompts und Validierung Die Validator-Erfolgsrate bleibt innerhalb Ihrer Launch-Schwelle
Langer Kontext Große Prompts, Trunkierung, Cache-Annahmen Das Kontext-Handling ist vorhersehbar und die Kosten sind akzeptabel
Flatkey-Observability Routenstatus, Modell-ID, Token-Nutzung, Kosten und Fehlerprotokolle Dashboard-Einträge stimmen mit der von Ihnen gesendeten Anfrage überein
Rollback Vorheriger Anbieter oder Fallback-Modell Traffic kann per Konfiguration ohne Deployment zurückgeschaltet werden

Häufige Fehler

  • DeepSeek V4-Migration als globales Suchen-und-Ersetzen zu behandeln, ohne die Ausgabe zu prüfen.
  • deepseek-reasoner zu ersetzen, aber zu vergessen, reasoning_content in Multi-Turn-Konversationen zu testen.
  • Aliase in Eval-Jobs, Support-Beispielen oder Fallback-Regeln zu belassen, während der Produktionscode V4-IDs verwendet.
  • Davon auszugehen, dass direktes DeepSeek- und geroutetes Flatkey-Verhalten identisch ist, ohne den Routing-Status und die Nutzungsprotokolle zu prüfen.
  • Eine Modell-ID aus einem alten Artikel zu kopieren, statt von der aktuellen Flatkey-Preisseite oder dem Dashboard.
  • Kostenprüfungen zu überspringen, nur weil der erste Smoke-Test eine normale Antwort liefert.
  • Bis zum 24. Juli 2026 zu warten und dann festzustellen, dass ein geplanter Job oder Background Worker immer noch einen nicht mehr zugänglichen Alias verwendet.

Wie dies mit anderen Flatkey-Migrationsleitfäden zusammenpasst

Wenn Sie die Provider-Konfiguration noch nicht zentralisiert haben, beginnen Sie mit dem umfassenderen Leitfaden zur Migration der OpenAI-kompatiblen API. Er behandelt Änderungen der Basis-URL, Smoke-Tests und Rollback-Muster, die über DeepSeek hinaus gelten.

Wenn Sie noch entscheiden, ob Sie DeepSeek direkt oder über ein Gateway ansteuern möchten, vergleichen Sie diese Seite mit dem bestehenden Leitfaden zum DeepSeek-API-Zugriff. Für Budgetierung und Prüfungen der Modellzeilen verwenden Sie den Workflow zum Preisvergleich von KI-Modellen sowie die aktuelle Seite mit den Flatkey-Preisen.

FAQ

Wann werden deepseek-chat und deepseek-reasoner eingestellt?

In den offiziellen DeepSeek-Dokumenten ist der 24. Juli 2026 um 15:59 UTC als Abschaltzeit angegeben, nach der deepseek-chat und deepseek-reasoner nicht mehr zugänglich sein werden. Planen Sie Ihre DeepSeek V4-Migration vor diesem Datum.

Was sollte deepseek-chat ersetzen?

Für das ähnlichste Verhalten testen Sie deepseek-v4-flash mit Non-Thinking-Verhalten. DeepSeek sagt, dass deepseek-chat derzeit im Non-Thinking-Modus auf deepseek-v4-flash weitergeleitet wird.

Was sollte deepseek-reasoner ersetzen?

Testen Sie deepseek-v4-flash oder deepseek-v4-pro mit aktiviertem Thinking, je nach Ihren Anforderungen an Qualität, Kosten und Latenz. DeepSeek sagt, dass deepseek-reasoner derzeit im Thinking-Modus auf deepseek-v4-flash weitergeleitet wird.

Muss ich die DeepSeek-Basis-URL ändern?

Für direkte DeepSeek-OpenAI-Format-Aufrufe bleibt die offizielle Basis-URL https://api.deepseek.com. Für Flatkey-Aufrufe verwenden Sie https://router.flatkey.ai/v1 und einen Flatkey-API-Schlüssel.

Unterstützt Flatkey DeepSeek V4?

Der Flatkey-Preis-API-Snapshot vom 16. Juni 2026 listete deepseek-v4-pro und deepseek-v4-flash mit openai-Endpoint-Unterstützung auf. Derselbe Snapshot zeigte für diese Zeilen den Verfügbarkeitsstatus unknown_failure an. Prüfen Sie daher die aktuelle Preisseite, den Dashboard-Route-Status und führen Sie vor produktivem Traffic einen Live-Smoke-Test durch.

Sollte ich deepseek-v4-flash oder deepseek-v4-pro wählen?

Verwenden Sie deepseek-v4-flash als ersten Ersatzkandidaten für die Kompatibilität mit alten Aliassen. Testen Sie deepseek-v4-pro, wenn die Workload stärkere Reasoning- oder Agentenfähigkeit benötigt und Ihre Prüfungen für Latenz und Kosten erfolgreich sind.

Preise ansehen, bevor Sie den Produktionsverkehr umstellen

DeepSeek V4-Migration ist der richtige Zeitpunkt, veraltete Aliase zu entfernen, das Thinking-Verhalten explizit zu machen und die Modellauswahl hinter eine Konfiguration zu legen. Bestätigen Sie vor dem Rollout die aktuelle Flatkey-Modellzeile, den Routing-Status, die Nutzungsprotokolle und die Preise für deepseek-v4-flash oder deepseek-v4-pro.

Preise ansehen, um die aktuellen Flatkey-DeepSeek-V4-Zeilen zu prüfen, bevor Sie Produktionsverkehr umstellen.