Migration aus OpenAI

Schritt-für-Schritt-Anleitung: bestehende Anwendung von OpenAI auf SovrGPT umstellen.

In der Regel sind drei Änderungen nötig:

baseURL ändern.
API-Key austauschen.
Modell-ID ersetzen.

Mehr nicht. Streaming, Function-Calling, JSON-Modus, Vision — alles funktioniert.

1. `baseURL` setzen

Vorher (OpenAI)	Nachher (SovrGPT)
`https://api.openai.com/v1`	`https://sovrgpt.com/api/v1`

Bei den meisten SDKs: client.base_url = "https://sovrgpt.com/api/v1" oder new OpenAI({ baseURL: "https://sovrgpt.com/api/v1" }).

2. API-Key austauschen

OpenAI-Keys (sk-…) ersetzen durch SovrGPT-Keys (sk-sovr-…). Erzeugen unter Settings → API-Keys, siehe Authentifizierung.

Tipp: ENV-Variable in OPENAI_API_KEY einfach mit dem SovrGPT-Key überschreiben — nichts im Code ändern. Aber: Achte darauf, dass dieselbe Variable nicht versehentlich noch mit OpenAI-Calls geteilt wird.

3. Modell-ID ersetzen

OpenAI	SovrGPT-Äquivalent	Anmerkung
`gpt-4o`	`qwen3.5-35b-a3b` (premium)	Vergleichbare Qualität, deutlich günstiger.
`gpt-4o-mini`	`qwen3.5-9b` (default)	Beide klein und schnell.
`gpt-4-turbo`	`qwen3.6-27b` (balanced)	Tiefer als gpt-4o-mini.
`o1` / `o1-mini`	`qwen3.5-9b-deepseek-v4-flash` (reasoning)	Sichtbare `<think>`-Schritte.
`gpt-4o-vision-preview`	`gemma-4-26b-a4b` (vision)	Multimodal.

Die exakten Mapping-Empfehlungen aktualisieren wir mit jedem Modell-Refresh in Modelle.

Beispiel: Diff einer Python-App

 from openai import OpenAI

 client = OpenAI(
-    api_key=os.environ["OPENAI_API_KEY"],
+    api_key=os.environ["SOVR_API_KEY"],
+    base_url="https://sovrgpt.com/api/v1",
 )

 resp = client.chat.completions.create(
-    model="gpt-4o-mini",
+    model="qwen3.5-9b",
     messages=[{"role": "user", "content": "Hallo!"}],
 )

Drei Zeilen. Mehr nicht.

Was ist nicht 1:1 verfügbar?

Embeddings — text-embedding-3-* haben wir noch nicht in v1. Geplant Q3/2026.
DALL·E 3 — wir bieten Z-Image und FLUX.2 im Chat-UI; dedizierter /v1/images/generations-Endpoint folgt Q3/2026.
Whisper / TTS — nicht im aktuellen v1, geplant Q4/2026.
Assistants-API — wird wahrscheinlich nicht implementiert; nutze stattdessen unseren Marketplace + Scheduled Jobs.
Realtime-API (WebRTC) — kein Roadmap-Eintrag in 2026.

Für jeden dieser Bausteine empfehlen wir hybrides Vorgehen: SovrGPT für Chat-Completions (≥80 % der Last), OpenAI nur für die spezifischen fehlenden Features (≤20 %). Dadurch bleibt der Großteil der Daten in der EU.

Performance-Tuning

Cold-Start vermeiden: bei produktiven Cron-Jobs (z. B. nächtlich) einen kleinen Warm-Up-Request 30 s vor der eigentlichen Last schicken.
Streaming nutzen: bei längeren Antworten verbessert SSE die wahrgenommene Latenz drastisch.
Modell richtig wählen: default-Tier statt premium spart Geld und Latenz, wenn keine Tiefe nötig.
Token-Limit setzen: max_tokens aktiv setzen — verhindert ausufernde Antworten und überraschende Rechnungen.

Daten-Migration

Bestehende OpenAI-Threads / Assistants lassen sich nicht direkt importieren.
Embeddings müssen neu erzeugt werden (anderer Vektorraum).
System-Prompts funktionieren ohne Änderung.

Bei größeren Migrationen (≥10 Apps): kontakt@e-networkers.de kontaktieren, wir bieten kostenlose 1-Stunden-Migrations-Beratung.