Migration aus OpenAI
Schritt-für-Schritt-Anleitung: bestehende Anwendung von OpenAI auf SovrGPT umstellen.
In der Regel sind drei Änderungen nötig:
baseURLändern.- API-Key austauschen.
- Modell-ID ersetzen.
Mehr nicht. Streaming, Function-Calling, JSON-Modus, Vision — alles funktioniert.
1. baseURL setzen
| Vorher (OpenAI) | Nachher (SovrGPT) |
|---|---|
https://api.openai.com/v1 | https://sovrgpt.com/api/v1 |
Bei den meisten SDKs: client.base_url = "https://sovrgpt.com/api/v1" oder
new OpenAI({ baseURL: "https://sovrgpt.com/api/v1" }).
2. API-Key austauschen
OpenAI-Keys (sk-…) ersetzen durch SovrGPT-Keys (sk-sovr-…). Erzeugen
unter Settings → API-Keys, siehe
Authentifizierung.
Tipp: ENV-Variable in
OPENAI_API_KEYeinfach mit dem SovrGPT-Key überschreiben — nichts im Code ändern. Aber: Achte darauf, dass dieselbe Variable nicht versehentlich noch mit OpenAI-Calls geteilt wird.
3. Modell-ID ersetzen
| OpenAI | SovrGPT-Äquivalent | Anmerkung |
|---|---|---|
gpt-4o | qwen3.5-35b-a3b (premium) | Vergleichbare Qualität, deutlich günstiger. |
gpt-4o-mini | qwen3.5-9b (default) | Beide klein und schnell. |
gpt-4-turbo | qwen3.6-27b (balanced) | Tiefer als gpt-4o-mini. |
o1 / o1-mini | qwen3.5-9b-deepseek-v4-flash (reasoning) | Sichtbare <think>-Schritte. |
gpt-4o-vision-preview | gemma-4-26b-a4b (vision) | Multimodal. |
Die exakten Mapping-Empfehlungen aktualisieren wir mit jedem Modell-Refresh in Modelle.
Beispiel: Diff einer Python-App
from openai import OpenAI
client = OpenAI(
- api_key=os.environ["OPENAI_API_KEY"],
+ api_key=os.environ["SOVR_API_KEY"],
+ base_url="https://sovrgpt.com/api/v1",
)
resp = client.chat.completions.create(
- model="gpt-4o-mini",
+ model="qwen3.5-9b",
messages=[{"role": "user", "content": "Hallo!"}],
)Drei Zeilen. Mehr nicht.
Was ist nicht 1:1 verfügbar?
- Embeddings —
text-embedding-3-*haben wir noch nicht in v1. Geplant Q3/2026. - DALL·E 3 — wir bieten Z-Image und FLUX.2 im Chat-UI; dedizierter
/v1/images/generations-Endpoint folgt Q3/2026. - Whisper / TTS — nicht im aktuellen v1, geplant Q4/2026.
- Assistants-API — wird wahrscheinlich nicht implementiert; nutze stattdessen unseren Marketplace + Scheduled Jobs.
- Realtime-API (WebRTC) — kein Roadmap-Eintrag in 2026.
Für jeden dieser Bausteine empfehlen wir hybrides Vorgehen: SovrGPT für Chat-Completions (≥80 % der Last), OpenAI nur für die spezifischen fehlenden Features (≤20 %). Dadurch bleibt der Großteil der Daten in der EU.
Performance-Tuning
- Cold-Start vermeiden: bei produktiven Cron-Jobs (z. B. nächtlich) einen kleinen Warm-Up-Request 30 s vor der eigentlichen Last schicken.
- Streaming nutzen: bei längeren Antworten verbessert SSE die wahrgenommene Latenz drastisch.
- Modell richtig wählen:
default-Tier stattpremiumspart Geld und Latenz, wenn keine Tiefe nötig. - Token-Limit setzen:
max_tokensaktiv setzen — verhindert ausufernde Antworten und überraschende Rechnungen.
Daten-Migration
- Bestehende OpenAI-Threads / Assistants lassen sich nicht direkt importieren.
- Embeddings müssen neu erzeugt werden (anderer Vektorraum).
- System-Prompts funktionieren ohne Änderung.
Bei größeren Migrationen (≥10 Apps): kontakt@e-networkers.de kontaktieren, wir bieten kostenlose 1-Stunden-Migrations-Beratung.