Model and Modality Playbooks22. Juni 2026Big Y

DeepSeek V4 Migrations-Checkliste: Veraltete Aliases sicher ersetzen

Nutzen Sie diese DeepSeek V4 Migrations-Checkliste, um deepseek-chat und deepseek-reasoner zu ersetzen, den Thinking-Modus zu testen, Flatkey-Routing zu prüfen und bei Bedarf sicher zurückzurollen.

DeepSeek V4-Migration ist jetzt eine deadline-getriebene Aufräumaufgabe und nicht nur ein Modell-Upgrade. In den offiziellen API-Dokumenten von DeepSeek heißt es, dass die älteren Aliase deepseek-chat und deepseek-reasoner nach dem 24. Juli 2026 um 15:59 UTC vollständig außer Betrieb genommen und nicht mehr zugänglich sein werden. Die unterstützten V4-Modell-IDs sind deepseek-v4-flash und deepseek-v4-pro.

Die gute Nachricht ist, dass dies für viele Teams eine kontrollierte Konfigurationsänderung sein sollte. DeepSeek empfiehlt, dieselbe direkte base_url beizubehalten und nur den Modellnamen zu aktualisieren. Wenn Sie Modelle über Flatkey weiterleiten, gilt dasselbe: Lassen Sie Ihre App weiterhin auf https://router.flatkey.ai/v1 zeigen, ersetzen Sie den Alias durch eine aktuelle Flatkey-DeepSeek-V4-Modellzeile und prüfen Sie das Antwortverhalten, den Thinking-Modus, Nutzungsprotokolle, Preise und das Rollback, bevor produktiver Traffic umgestellt wird.

Diese Checkliste zur DeepSeek V4-Migration gibt Ihnen die konkreten Schritte: alte Aliase zuordnen, deepseek-v4-flash oder deepseek-v4-pro wählen, Thinking- und Nicht-Thinking-Verhalten testen, die SDK-Konfiguration aktualisieren und einen ungeprüften Modellwechsel kurz vor dem Stichtag vermeiden.

Schnelle Antwort: Was ändert sich bei einer DeepSeek-V4-Migration?

Die dringende Änderung ist die Modellzeichenfolge. Lassen Sie Produktionscode, Umgebungsvariablen, Prompt-Router, Eval-Jobs oder Fallback-Richtlinien nicht fest auf deepseek-chat oder deepseek-reasoner codiert.

Altes Alias	Aktuelles offizielles Verhalten	Zu testendes Migrationsziel	Zu überprüfendes Risiko
`deepseek-chat`	Leitet derzeit in den Nicht-Denkmodus von `deepseek-v4-flash` um	`deepseek-v4-flash` mit deaktiviertem Thinking, sofern Sie nicht absichtlich einen anderen V4-Modus wählen	Ausgabestil, Latenz, Kosten, Parser-Kompatibilität und alle ignorierten Parameter
`deepseek-reasoner`	Leitet derzeit in den Denkmodus von `deepseek-v4-flash` um	`deepseek-v4-flash` oder `deepseek-v4-pro` mit explizit getesteten Thinking-Einstellungen	`reasoning_content`, Token-Nutzung, Multi-Turn-Verarbeitung und SDK-Unterstützung
Claude-ähnliche Modellnamen in der DeepSeek-Anthropic-API	DeepSeek ordnet Claude-Opus-Namen V4 Pro und Claude-Haiku/Sonnet-Namen V4 Flash zu	Bevorzugen Sie explizite DeepSeek-V4-Modell-IDs, sofern Ihre Routing-Schicht dies zulässt	Nicht unterstützte Anthropic-Felder, Unterstützung für Bild-/Dokumentinhalte und Verhalten bei Tool-Aufrufen

Für einen direkten DeepSeek-Aufruf bleibt die offizielle OpenAI-kompatible Base-URL https://api.deepseek.com. Für Flatkey bleibt die Router-Base-URL https://router.flatkey.ai/v1. In beiden Fällen sollte die DeepSeek-V4-Migration als Modell- und Verhaltensänderung getestet werden, nicht nur als Suchen-und-Ersetzen.

Warum die Alias-Deadline wichtig ist

Die V4-Vorschauseite von DeepSeek sagt, dass die API jetzt verfügbar ist, sowohl deepseek-v4-pro als auch deepseek-v4-flash unterstützen 1M Kontext sowie sowohl den Thinking- als auch den Non-Thinking-Modus, und die älteren Aliase werden nach dem 24. Juli 2026 um 15:59 UTC eingestellt. Das bedeutet, dass ein veralteter Alias nach dem Auslaufzeitraum von „funktioniert heute“ zu „hartem Fehler“ werden kann.

Die Schnellstarttabelle auf der Homepage führt außerdem deepseek-chat und deepseek-reasoner als Aliase auf, die am 2026/07/24 veraltet sein werden. Dort wird darauf hingewiesen, dass diese Aliase zur Kompatibilität den Non-Thinking- und Thinking-Modi von deepseek-v4-flash entsprechen.

Dieses Kompatibilitätsdetail ist nützlich, aber kein Grund zu warten. Eine saubere DeepSeek V4-Migration gibt Ihnen Zeit, Ausgaben zu vergleichen, Runbooks zu aktualisieren, Support-Teams zu schulen und sicherzustellen, dass Produktions-Dashboards vor der Deadline die neuen Modell-IDs anzeigen.

Direct DeepSeek versus Flatkey-Routing

Es gibt zwei gängige Migrationspfade.

Entscheidung	Direkte DeepSeek API	DeepSeek über Flatkey
Basis-URL	`https://api.deepseek.com`	`https://router.flatkey.ai/v1`
API-Schlüssel	DeepSeek API-Schlüssel	Flatkey API-Schlüssel
Modellauswahl	Offizielle DeepSeek-Modell-ID	Aktuelle Flatkey-DeepSeek-Modellzeile
Hauptvorteil	Einrichtung direkt beim Anbieter	Ein Schlüssel, ein Router, gemeinsame Nutzungsprotokolle, Kontingente und Abrechnungs-Transparenz über Anbieter hinweg
Produktionsprüfung	DeepSeek-Antwort, Thinking-Modus, Preisgestaltung und Fehler	Antwort, Routing-Status, ausgewählte Modellzeile, Nutzungsprotokoll, Preiseinheit, Kontingent und Rollback

Der öffentliche Produkttext von Flatkey positioniert die Plattform rund um einen API-Schlüssel, eine mit OpenAI kompatible Basis-URL, klare Preise, vereinheitlichte Abrechnung und ein Dashboard für Schlüssel, Nutzung und Routing. Für Teams, die bereits GPT-, Claude-, Gemini-, Qwen-, MiniMax- und DeepSeek-Traffic über ein Gateway leiten, ist eine DeepSeek-V4-Migration ein guter Zeitpunkt, um Modell-IDs und Logging über den gesamten Stack hinweg zu standardisieren.

Flatkey Catalog Check For DeepSeek V4

Für diesen Artikel habe ich am 16. Juni 2026 Flatkeys öffentliche Pricing-API geprüft. Der Snapshot lieferte insgesamt 638 Modellzeilen und 19 Zeilen mit DeepSeek-Namen. Er listete sowohl deepseek-v4-pro als auch deepseek-v4-flash in der Standard-Gruppe mit openai-Endpoint-Unterstützung auf.

Betrachten Sie das als datierten Katalognachweis, nicht als Zusage, dass Ihr Konto und Ihr Pfad bereit sind. Im selben Snapshot hatten beide V4-Zeilen den Verfügbarkeitsstatus unknown_failure, was bedeutet, dass die Verfügbarkeit in der aktuellen Flatkey-Preisansicht oder im Dashboard bestätigt werden sollte, bevor der reale Traffic von diesem Pfad abhängt. Eine sorgfältige DeepSeek-V4-Migration sollte am Tag des Wechsels einen Live-Smoke-Test und eine Prüfung der Nutzungsprotokolle umfassen.

DeepSeek V4-Migrations-Checkliste

Verwenden Sie diese Checkliste, bevor Sie Aliase in der Produktion ersetzen.

Inventarisieren Sie jeden Alias. Durchsuchen Sie Anwendungscode, Umgebungsvariablen, Prompt-Router-Regeln, Eval-Konfigurationen, Hintergrundjobs, Notebooks, Dokus und Support-Runbooks nach deepseek-chat und deepseek-reasoner.
Klassifizieren Sie jede Workload. Markieren Sie jede Route als Chat, Reasoning, Agent-Tool-Nutzung, strukturierte Ausgabe, langen Kontext, Batch-Eval oder nur-Fallback. Gehen Sie nicht davon aus, dass jede Route in denselben V4-Modus wechseln sollte.
Wählen Sie das Zielmodell. Beginnen Sie mit deepseek-v4-flash, wenn Sie den möglichst nahen Ersatz für die aktuellen Aliase möchten. Evaluieren Sie deepseek-v4-pro, wenn die Workload stärkere Fähigkeiten benötigt und Sie nach dem Testen das Kosten- und Latenzprofil akzeptieren können.
Machen Sie Thinking explizit. Testen Sie für das alte Verhalten von deepseek-chat den Nicht-Thinking-Modus. Testen Sie für das alte Verhalten von deepseek-reasoner den Thinking-Modus und bestätigen Sie, wie Ihr SDK reasoning_content behandelt.
Halten Sie Modell-IDs in der Konfiguration. Legen Sie das Zielmodell in einer Umgebungsvariable oder Routing-Tabelle ab, nicht inline in der Anwendungslogik.
Führen Sie gepaarte Ausgabetests aus. Vergleichen Sie Antworten des alten Alias mit neuen V4-Antworten auf repräsentativen Prompts, Parsern, JSON-Mode-Aufgaben, Tool-Aufrufen und Verweigerungs-/Fehlerfällen.
Verifizieren Sie Streaming und Usage-Abrechnung. Prüfen Sie, ob die finale Usage dort erscheint, wo Ihr Billing- oder Observability-Code sie erwartet, insbesondere bei Streaming-Antworten.
Prüfen Sie Kosten und Kontingente. Bestätigen Sie die Provider-Preise oder Flatkey-Preise und setzen Sie dann ein niedriges Kontingent oder Testbudget, bevor der Produktionsverkehr ansteigt.
Protokollieren Sie die neue Modell-ID. Stellen Sie sicher, dass Traces, Alerts und Billing-Exporte deepseek-v4-flash oder deepseek-v4-pro anzeigen und nicht nur ein generisches Provider-Label.
Bereiten Sie ein Rollback vor. Behalten Sie einen früheren Provider oder ein Fallback-Modell konfiguriert, bis die V4-Route reale Workload-Tests bestanden hat.
Entfernen Sie veraltete Dokus. Aktualisieren Sie interne Einrichtungsanleitungen, damit neue Entwickler keine veralteten Aliase zurück in die Produktion kopieren.

Konfigurationstemplate für Flatkey

Nur Vorlage: Führen Sie dies mit einem gültigen Flatkey-Schlüssel und einer bestätigten Flatkey DeepSeek V4-Modell-ID aus dem aktuellen Katalog aus. Die Struktur ist gewöhnliche OpenAI-SDK-Nutzung, aber Route, Modellstatus, Thinking-Verhalten und Nutzungsprotokoll müssen trotzdem getestet werden.

FLATKEY_API_KEY="sk-fk-your-key"
OPENAI_BASE_URL="https://router.flatkey.ai/v1"
FLATKEY_DEEPSEEK_MODEL="deepseek-v4-flash"

# Ziel während der Einführung leicht änderbar halten.
# Für den direkten DeepSeek-Vergleich:
DEEPSEEK_BASE_URL="https://api.deepseek.com"

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["FLATKEY_API_KEY"],
    base_url=os.environ.get("OPENAI_BASE_URL", "https://router.flatkey.ai/v1"),
)

response = client.chat.completions.create(
    model=os.environ.get("FLATKEY_DEEPSEEK_MODEL", "deepseek-v4-flash"),
    messages=[
        {
            "role": "user",
            "content": "Antworten Sie mit einem Satz und bestätigen Sie, dass die DeepSeek-V4-Route konfiguriert ist.",
        }
    ],
)

print(response.choices[0].message.content)
print(response.usage)

Für direktes DeepSeek-Testing folgen Sie den offiziellen OpenAI-SDK-Beispielen von DeepSeek für den Thinking-Modus. Der Thinking-Guide sagt, dass der Thinking-Schalter standardmäßig aktiviert ist, der Effort-Parameter im OpenAI-Format high und max unterstützt und niedrigere Effort-Bezeichnungen aus Kompatibilitätsgründen nach oben gemappt werden. Wenn Ihre App von Antworten ohne Thinking abhängt, treffen Sie diese Entscheidung explizit und testen Sie sie, statt sich auf einen Alias zu verlassen.

Testmatrix vor dem Cutover

Eine DeepSeek V4-Migration sollte erst freigegeben werden, nachdem Sie das Verhalten getestet haben, das Ihr Produkt tatsächlich verwendet.

Test	Was zu prüfen ist	Erfolgsindikator
Basis-Chat	Einfacher Prompt, Antwortstruktur, Parser-Verhalten	Die App erhält erwarteten Inhalt ohne Schema- oder Rollenfehler
Thinking-Modus	`thinking`, `reasoning_effort` und `reasoning_content`	Reasoning-Ausgabe wird gemäß Ihrer Produktpolicy verarbeitet oder absichtlich unterdrückt
Streaming	Chunk-Format, finale Nutzung, Timeout-Verhalten	Client-Parser und Billing-Hooks funktionieren weiterhin
Tool-Aufrufe	Tool-Schema, Argumente, mehrstufige Agenten-Turns	Tool-Aufrufe werden erzeugt und verarbeitet, ohne fehlerhaftes JSON oder fehlende IDs
Strukturierte Ausgabe	JSON-Mode-Prompts und Validierung	Die Validator-Erfolgsrate bleibt innerhalb Ihrer Launch-Schwelle
Langer Kontext	Große Prompts, Trunkierung, Cache-Annahmen	Das Kontext-Handling ist vorhersehbar und die Kosten sind akzeptabel
Flatkey-Observability	Routenstatus, Modell-ID, Token-Nutzung, Kosten und Fehlerprotokolle	Dashboard-Einträge stimmen mit der von Ihnen gesendeten Anfrage überein
Rollback	Vorheriger Anbieter oder Fallback-Modell	Traffic kann per Konfiguration ohne Deployment zurückgeschaltet werden

Häufige Fehler

DeepSeek V4-Migration als globales Suchen-und-Ersetzen zu behandeln, ohne die Ausgabe zu prüfen.
deepseek-reasoner zu ersetzen, aber zu vergessen, reasoning_content in Multi-Turn-Konversationen zu testen.
Aliase in Eval-Jobs, Support-Beispielen oder Fallback-Regeln zu belassen, während der Produktionscode V4-IDs verwendet.
Davon auszugehen, dass direktes DeepSeek- und geroutetes Flatkey-Verhalten identisch ist, ohne den Routing-Status und die Nutzungsprotokolle zu prüfen.
Eine Modell-ID aus einem alten Artikel zu kopieren, statt von der aktuellen Flatkey-Preisseite oder dem Dashboard.
Kostenprüfungen zu überspringen, nur weil der erste Smoke-Test eine normale Antwort liefert.
Bis zum 24. Juli 2026 zu warten und dann festzustellen, dass ein geplanter Job oder Background Worker immer noch einen nicht mehr zugänglichen Alias verwendet.

Wie dies mit anderen Flatkey-Migrationsleitfäden zusammenpasst

Wenn Sie die Provider-Konfiguration noch nicht zentralisiert haben, beginnen Sie mit dem umfassenderen Leitfaden zur Migration der OpenAI-kompatiblen API. Er behandelt Änderungen der Basis-URL, Smoke-Tests und Rollback-Muster, die über DeepSeek hinaus gelten.

Wenn Sie noch entscheiden, ob Sie DeepSeek direkt oder über ein Gateway ansteuern möchten, vergleichen Sie diese Seite mit dem bestehenden Leitfaden zum DeepSeek-API-Zugriff. Für Budgetierung und Prüfungen der Modellzeilen verwenden Sie den Workflow zum Preisvergleich von KI-Modellen sowie die aktuelle Seite mit den Flatkey-Preisen.

FAQ

Wann werden `deepseek-chat` und `deepseek-reasoner` eingestellt?

In den offiziellen DeepSeek-Dokumenten ist der 24. Juli 2026 um 15:59 UTC als Abschaltzeit angegeben, nach der deepseek-chat und deepseek-reasoner nicht mehr zugänglich sein werden. Planen Sie Ihre DeepSeek V4-Migration vor diesem Datum.

Was sollte `deepseek-chat` ersetzen?

Für das ähnlichste Verhalten testen Sie deepseek-v4-flash mit Non-Thinking-Verhalten. DeepSeek sagt, dass deepseek-chat derzeit im Non-Thinking-Modus auf deepseek-v4-flash weitergeleitet wird.

Was sollte `deepseek-reasoner` ersetzen?

Testen Sie deepseek-v4-flash oder deepseek-v4-pro mit aktiviertem Thinking, je nach Ihren Anforderungen an Qualität, Kosten und Latenz. DeepSeek sagt, dass deepseek-reasoner derzeit im Thinking-Modus auf deepseek-v4-flash weitergeleitet wird.

Muss ich die DeepSeek-Basis-URL ändern?

Für direkte DeepSeek-OpenAI-Format-Aufrufe bleibt die offizielle Basis-URL https://api.deepseek.com. Für Flatkey-Aufrufe verwenden Sie https://router.flatkey.ai/v1 und einen Flatkey-API-Schlüssel.

Unterstützt Flatkey DeepSeek V4?

Der Flatkey-Preis-API-Snapshot vom 16. Juni 2026 listete deepseek-v4-pro und deepseek-v4-flash mit openai-Endpoint-Unterstützung auf. Derselbe Snapshot zeigte für diese Zeilen den Verfügbarkeitsstatus unknown_failure an. Prüfen Sie daher die aktuelle Preisseite, den Dashboard-Route-Status und führen Sie vor produktivem Traffic einen Live-Smoke-Test durch.

Sollte ich `deepseek-v4-flash` oder `deepseek-v4-pro` wählen?

Verwenden Sie deepseek-v4-flash als ersten Ersatzkandidaten für die Kompatibilität mit alten Aliassen. Testen Sie deepseek-v4-pro, wenn die Workload stärkere Reasoning- oder Agentenfähigkeit benötigt und Ihre Prüfungen für Latenz und Kosten erfolgreich sind.

Preise ansehen, bevor Sie den Produktionsverkehr umstellen

DeepSeek V4-Migration ist der richtige Zeitpunkt, veraltete Aliase zu entfernen, das Thinking-Verhalten explizit zu machen und die Modellauswahl hinter eine Konfiguration zu legen. Bestätigen Sie vor dem Rollout die aktuelle Flatkey-Modellzeile, den Routing-Status, die Nutzungsprotokolle und die Preise für deepseek-v4-flash oder deepseek-v4-pro.

Preise ansehen, um die aktuellen Flatkey-DeepSeek-V4-Zeilen zu prüfen, bevor Sie Produktionsverkehr umstellen.