GET /v1/models

Listet alle für die aufrufende Org freigeschalteten Modelle.

curl https://sovrgpt.com/api/v1/models \
  -H "Authorization: Bearer $SOVR_KEY"

Antwort

{
  "object": "list",
  "data": [
    {
      "id": "qwen3.5-9b",
      "object": "model",
      "created": 1715520000,
      "owned_by": "sovrgpt",

      "tier": "default",
      "display_name": "Qwen 3.5 9B",
      "subtitle": "Schnellantwort · multimodal-fähig",
      "capabilities": {
        "reasoning": 3,
        "coding": 3,
        "vision": 3,
        "speed": 5,
        "german": 4
      },
      "accepts_vision": true,
      "license": "Apache 2.0",
      "cold_start_hint": "warm meist <5 s, Cold-Start typisch 30–90 s"
    },
    {
      "id": "qwen3.6-27b",
      "object": "model",
      "owned_by": "sovrgpt",
      "tier": "balanced",
      "display_name": "Qwen 3.6 27B",
      "subtitle": "Mehr Tiefe, akzeptable Latenz",
      "license": "Apache 2.0"
    }
    /* … weitere Tiers … */
  ]
}

Felder

Standard-OpenAI-Felder

Feld	Typ	Beschreibung
`id`	string	Modell-ID (in `chat/completions` als `model` einsetzbar).
`object`	string	Immer `"model"`.
`created`	integer	Unix-Timestamp der Modell-Aktivierung.
`owned_by`	string	Immer `"sovrgpt"`.

SovrGPT-Erweiterungen

Feld	Typ	Beschreibung
`kind`	enum	`chat` / `embedding` / `rerank` / `tts` / `stt` — sagt, über welchen Endpoint das Modell adressiert wird (`/v1/chat/completions`, `/v1/embeddings`, `/v1/rerank`, `/v1/audio/speech`, `/v1/audio/transcriptions`).
`tier`	enum	Nur bei `kind: "chat"`: `default` / `balanced` / `premium` / `reasoning` / `vision` / `coder` / `llama`.
`display_name`	string	Schöner Name für UIs.
`subtitle`	string	Kurzer Untertitel für Picker.
`capabilities`	object	1–5-Skalen für `reasoning`, `coding`, `vision`, `speed`, `german`. Picker-UIs zeigen daraus Sterne / Balken.
`accepts_vision`	boolean	True, wenn das Modell Bilder im Multipart-Format akzeptiert.
`license`	string	Lizenz-Label (`Apache 2.0`, `Llama Community License`, …).
`cold_start_hint`	string	Menschen-lesbarer Hinweis zur erwarteten Cold-Start-Dauer.

OpenAI-Clients ignorieren unbekannte Felder — alle Erweiterungen sind additiv.

Audio-Modelle (TTS/STT) in der Liste

Auch die Sprach-Modelle erscheinen hier mit kind: "tts" bzw. kind: "stt" — so kannst du programmatisch abfragen, welche Stimm-Engines verfügbar sind:

{ "id": "supertonic-3",  "kind": "tts", "display_name": "Supertonic 3 — Text-to-Speech" }
{ "id": "cosyvoice-3",   "kind": "tts", "display_name": "CosyVoice 3 — Expressive TTS + Voice-Cloning" }
{ "id": "voxtral-mini-transcribe", "kind": "stt", "display_name": "Voxtral Mini Transcribe — Speech-to-Text" }

Die passende id gibst du dann als model an POST /v1/audio/speech bzw. /v1/audio/transcriptions — siehe Audio-API.

Filter / Pagination

Aktuell keine Filter. Die Liste ist kurz (≤10 Einträge), Pagination nicht nötig. Falls in Zukunft >100 Modelle aktiv sind, kommt ?limit=/?after= analog zu OpenAI.

Antworten ändern sich selten (≤ein Update pro Woche). Wir empfehlen clientseitiges Caching mit TTL = 1 Stunde. Bei Modell-Wechseln gibt es kein Push — Clients sollen nach 401/404 die Liste erneut laden.