API
API-Übersicht
OpenAI-kompatible HTTP-API auf europäischer Infrastruktur.
SovrGPT bietet eine OpenAI-kompatible HTTP-API. Bestehende OpenAI-Clients
funktionieren ohne Code-Änderung — nur baseURL und model umstellen.
Base-URL: https://sovrgpt.com/api/v1
Was ist verfügbar?
| Endpoint | Status | Anmerkung |
|---|---|---|
GET /v1/models | stabil | Listet alle aktiven Modelle. |
POST /v1/chat/completions | stabil | Streaming via SSE oder JSON. |
POST /v1/embeddings | stabil | OpenAI-kompatibel · BGE-M3 & Nomic Embed Code, EU-sovereign. |
POST /v1/rerank | stabil | Cohere-kompatibel · BGE Reranker (Cross-Encoder). |
POST /mcp/mcp | stabil | Model Context Protocol — Chat-/Such-/Bild-/Video-Tools für Cursor, Claude Desktop, Zed, Windsurf. |
POST /mcp/docs/mcp | stabil | Öffentliche Doku-Suche via MCP, ohne API-Key. |
POST /v1/images/generations | geplant Q3/2026 | Z-Image / FLUX.2 als REST. |
POST /v1/audio/transcriptions | geplant Q4/2026 | Whisper auf RunPod EU. |
Schema-Kompatibilität
Wir folgen dem OpenAI-v1-Schema, Stand 2026-04. Felder, die in OpenAI
existieren aber bei uns nicht sinnvoll sind (z. B. seed bei einigen
Modellen, logit_bias), werden vom Server akzeptiert und stillschweigend
ignoriert — das verhindert Crashes in bestehenden Clients.
SovrGPT-spezifische Felder (z. B. tier in der Models-Antwort) liegen
zusätzlich zum OpenAI-Schema vor und brechen keine Standard-Clients.
Rate-Limits
- Standard-Plan: 100 Requests / Minute pro API-Key, faire Nutzung beim Token-Volumen.
- Pro-Plan: 1 000 Requests / Minute, höhere Token-Quota.
- Enterprise: Dediziert vereinbart.
429-Header bei Überschreitung:
Retry-After: 30
X-RateLimit-Limit: 100
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1715520000Versionierung
- Aktuelle Version:
v1. - Breaking Changes erhalten neue Versionsnummer (
v2,v3…) mit ≥6 Monaten Übergangszeit. - Additive Änderungen (neue Felder, neue Modell-IDs) werden im Changelog angekündigt: GitHub Releases.
Weiter
- Authentifizierung — wie API-Keys funktionieren.
- GET /v1/models — Modelle abfragen.
- POST /v1/chat/completions — der Hauptendpoint.
- MCP-Server — SovrGPT in Cursor / Claude Desktop / Zed / Windsurf einbinden.
- SDK-Beispiele — Python, Node, .NET.
- Migration aus OpenAI — Schritt-für-Schritt-Anleitung.