SovrGPT Docs
API

GET /v1/models

Alle aktiven Modelle abfragen.

Listet alle für die aufrufende Org freigeschalteten Modelle.

curl https://sovrgpt.com/api/v1/models \
  -H "Authorization: Bearer $SOVR_KEY"

Antwort

{
  "object": "list",
  "data": [
    {
      "id": "qwen3.5-9b",
      "object": "model",
      "created": 1715520000,
      "owned_by": "sovrgpt",

      "tier": "default",
      "display_name": "Qwen 3.5 9B",
      "subtitle": "Schnellantwort · multimodal-fähig",
      "capabilities": {
        "reasoning": 3,
        "coding": 3,
        "vision": 3,
        "speed": 5,
        "german": 4
      },
      "accepts_vision": true,
      "license": "Apache 2.0",
      "cold_start_hint": "warm meist <5 s, Cold-Start typisch 30–90 s"
    },
    {
      "id": "qwen3.6-27b",
      "object": "model",
      "owned_by": "sovrgpt",
      "tier": "balanced",
      "display_name": "Qwen 3.6 27B",
      "subtitle": "Mehr Tiefe, akzeptable Latenz",
      "license": "Apache 2.0"
    }
    /* … weitere Tiers … */
  ]
}

Felder

Standard-OpenAI-Felder

FeldTypBeschreibung
idstringModell-ID (in chat/completions als model einsetzbar).
objectstringImmer "model".
createdintegerUnix-Timestamp der Modell-Aktivierung.
owned_bystringImmer "sovrgpt".

SovrGPT-Erweiterungen

FeldTypBeschreibung
tierenumdefault / balanced / premium / reasoning / vision / coder / llama.
display_namestringSchöner Name für UIs.
subtitlestringKurzer Untertitel für Picker.
capabilitiesobject1–5-Skalen für reasoning, coding, vision, speed, german. Picker-UIs zeigen daraus Sterne / Balken.
accepts_visionbooleanTrue, wenn das Modell Bilder im Multipart-Format akzeptiert.
licensestringLizenz-Label (Apache 2.0, Llama Community License, …).
cold_start_hintstringMenschen-lesbarer Hinweis zur erwarteten Cold-Start-Dauer.

OpenAI-Clients ignorieren unbekannte Felder — alle Erweiterungen sind additiv.

Filter / Pagination

Aktuell keine Filter. Die Liste ist kurz (≤10 Einträge), Pagination nicht nötig. Falls in Zukunft >100 Modelle aktiv sind, kommt ?limit=/?after= analog zu OpenAI.

Caching

Antworten ändern sich selten (≤ein Update pro Woche). Wir empfehlen clientseitiges Caching mit TTL = 1 Stunde. Bei Modell-Wechseln gibt es kein Push — Clients sollen nach 401/404 die Liste erneut laden.

GET /v1/models