SovrGPT Docs
API

Migration aus OpenAI

Schritt-für-Schritt-Anleitung: bestehende Anwendung von OpenAI auf SovrGPT umstellen.

In der Regel sind drei Änderungen nötig:

  1. baseURL ändern.
  2. API-Key austauschen.
  3. Modell-ID ersetzen.

Mehr nicht. Streaming, Function-Calling, JSON-Modus, Vision — alles funktioniert.

1. baseURL setzen

Vorher (OpenAI)Nachher (SovrGPT)
https://api.openai.com/v1https://sovrgpt.com/api/v1

Bei den meisten SDKs: client.base_url = "https://sovrgpt.com/api/v1" oder new OpenAI({ baseURL: "https://sovrgpt.com/api/v1" }).

2. API-Key austauschen

OpenAI-Keys (sk-…) ersetzen durch SovrGPT-Keys (sk-sovr-…). Erzeugen unter Settings → API-Keys, siehe Authentifizierung.

Tipp: ENV-Variable in OPENAI_API_KEY einfach mit dem SovrGPT-Key überschreiben — nichts im Code ändern. Aber: Achte darauf, dass dieselbe Variable nicht versehentlich noch mit OpenAI-Calls geteilt wird.

3. Modell-ID ersetzen

OpenAISovrGPT-ÄquivalentAnmerkung
gpt-4oqwen3.5-35b-a3b (premium)Vergleichbare Qualität, deutlich günstiger.
gpt-4o-miniqwen3.5-9b (default)Beide klein und schnell.
gpt-4-turboqwen3.6-27b (balanced)Tiefer als gpt-4o-mini.
o1 / o1-miniqwen3.5-9b-deepseek-v4-flash (reasoning)Sichtbare <think>-Schritte.
gpt-4o-vision-previewgemma-4-26b-a4b (vision)Multimodal.

Die exakten Mapping-Empfehlungen aktualisieren wir mit jedem Modell-Refresh in Modelle.

Beispiel: Diff einer Python-App

 from openai import OpenAI

 client = OpenAI(
-    api_key=os.environ["OPENAI_API_KEY"],
+    api_key=os.environ["SOVR_API_KEY"],
+    base_url="https://sovrgpt.com/api/v1",
 )

 resp = client.chat.completions.create(
-    model="gpt-4o-mini",
+    model="qwen3.5-9b",
     messages=[{"role": "user", "content": "Hallo!"}],
 )

Drei Zeilen. Mehr nicht.

Was ist nicht 1:1 verfügbar?

  • Embeddingstext-embedding-3-* haben wir noch nicht in v1. Geplant Q3/2026.
  • DALL·E 3 — wir bieten Z-Image und FLUX.2 im Chat-UI; dedizierter /v1/images/generations-Endpoint folgt Q3/2026.
  • Whisper / TTS — nicht im aktuellen v1, geplant Q4/2026.
  • Assistants-API — wird wahrscheinlich nicht implementiert; nutze stattdessen unseren Marketplace + Scheduled Jobs.
  • Realtime-API (WebRTC) — kein Roadmap-Eintrag in 2026.

Für jeden dieser Bausteine empfehlen wir hybrides Vorgehen: SovrGPT für Chat-Completions (≥80 % der Last), OpenAI nur für die spezifischen fehlenden Features (≤20 %). Dadurch bleibt der Großteil der Daten in der EU.

Performance-Tuning

  • Cold-Start vermeiden: bei produktiven Cron-Jobs (z. B. nächtlich) einen kleinen Warm-Up-Request 30 s vor der eigentlichen Last schicken.
  • Streaming nutzen: bei längeren Antworten verbessert SSE die wahrgenommene Latenz drastisch.
  • Modell richtig wählen: default-Tier statt premium spart Geld und Latenz, wenn keine Tiefe nötig.
  • Token-Limit setzen: max_tokens aktiv setzen — verhindert ausufernde Antworten und überraschende Rechnungen.

Daten-Migration

  • Bestehende OpenAI-Threads / Assistants lassen sich nicht direkt importieren.
  • Embeddings müssen neu erzeugt werden (anderer Vektorraum).
  • System-Prompts funktionieren ohne Änderung.

Bei größeren Migrationen (≥10 Apps): kontakt@e-networkers.de kontaktieren, wir bieten kostenlose 1-Stunden-Migrations-Beratung.

Migration aus OpenAI