SovrGPT Docs
API

API-Übersicht

OpenAI-kompatible HTTP-API auf europäischer Infrastruktur.

SovrGPT bietet eine OpenAI-kompatible HTTP-API. Bestehende OpenAI-Clients funktionieren ohne Code-Änderung — nur baseURL und model umstellen.

Base-URL: https://sovrgpt.com/api/v1

Was ist verfügbar?

EndpointStatusAnmerkung
GET /v1/modelsstabilListet alle aktiven Modelle.
POST /v1/chat/completionsstabilStreaming via SSE oder JSON.
POST /v1/embeddingsstabilOpenAI-kompatibel · BGE-M3 & Nomic Embed Code, EU-sovereign.
POST /v1/rerankstabilCohere-kompatibel · BGE Reranker (Cross-Encoder).
POST /mcp/mcpstabilModel Context Protocol — Chat-/Such-/Bild-/Video-Tools für Cursor, Claude Desktop, Zed, Windsurf.
POST /mcp/docs/mcpstabilÖffentliche Doku-Suche via MCP, ohne API-Key.
POST /v1/images/generationsgeplant Q3/2026Z-Image / FLUX.2 als REST.
POST /v1/audio/transcriptionsgeplant Q4/2026Whisper auf RunPod EU.

Schema-Kompatibilität

Wir folgen dem OpenAI-v1-Schema, Stand 2026-04. Felder, die in OpenAI existieren aber bei uns nicht sinnvoll sind (z. B. seed bei einigen Modellen, logit_bias), werden vom Server akzeptiert und stillschweigend ignoriert — das verhindert Crashes in bestehenden Clients.

SovrGPT-spezifische Felder (z. B. tier in der Models-Antwort) liegen zusätzlich zum OpenAI-Schema vor und brechen keine Standard-Clients.

Rate-Limits

  • Standard-Plan: 100 Requests / Minute pro API-Key, faire Nutzung beim Token-Volumen.
  • Pro-Plan: 1 000 Requests / Minute, höhere Token-Quota.
  • Enterprise: Dediziert vereinbart.

429-Header bei Überschreitung:

Retry-After: 30
X-RateLimit-Limit: 100
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1715520000

Versionierung

  • Aktuelle Version: v1.
  • Breaking Changes erhalten neue Versionsnummer (v2, v3 …) mit ≥6 Monaten Übergangszeit.
  • Additive Änderungen (neue Felder, neue Modell-IDs) werden im Changelog angekündigt: GitHub Releases.

Weiter

API-Übersicht