API
GET /v1/models
Alle aktiven Modelle abfragen.
Listet alle für die aufrufende Org freigeschalteten Modelle.
curl https://sovrgpt.com/api/v1/models \
-H "Authorization: Bearer $SOVR_KEY"Antwort
{
"object": "list",
"data": [
{
"id": "qwen3.5-9b",
"object": "model",
"created": 1715520000,
"owned_by": "sovrgpt",
"tier": "default",
"display_name": "Qwen 3.5 9B",
"subtitle": "Schnellantwort · multimodal-fähig",
"capabilities": {
"reasoning": 3,
"coding": 3,
"vision": 3,
"speed": 5,
"german": 4
},
"accepts_vision": true,
"license": "Apache 2.0",
"cold_start_hint": "warm meist <5 s, Cold-Start typisch 30–90 s"
},
{
"id": "qwen3.6-27b",
"object": "model",
"owned_by": "sovrgpt",
"tier": "balanced",
"display_name": "Qwen 3.6 27B",
"subtitle": "Mehr Tiefe, akzeptable Latenz",
"license": "Apache 2.0"
}
/* … weitere Tiers … */
]
}Felder
Standard-OpenAI-Felder
| Feld | Typ | Beschreibung |
|---|---|---|
id | string | Modell-ID (in chat/completions als model einsetzbar). |
object | string | Immer "model". |
created | integer | Unix-Timestamp der Modell-Aktivierung. |
owned_by | string | Immer "sovrgpt". |
SovrGPT-Erweiterungen
| Feld | Typ | Beschreibung |
|---|---|---|
tier | enum | default / balanced / premium / reasoning / vision / coder / llama. |
display_name | string | Schöner Name für UIs. |
subtitle | string | Kurzer Untertitel für Picker. |
capabilities | object | 1–5-Skalen für reasoning, coding, vision, speed, german. Picker-UIs zeigen daraus Sterne / Balken. |
accepts_vision | boolean | True, wenn das Modell Bilder im Multipart-Format akzeptiert. |
license | string | Lizenz-Label (Apache 2.0, Llama Community License, …). |
cold_start_hint | string | Menschen-lesbarer Hinweis zur erwarteten Cold-Start-Dauer. |
OpenAI-Clients ignorieren unbekannte Felder — alle Erweiterungen sind additiv.
Filter / Pagination
Aktuell keine Filter. Die Liste ist kurz (≤10 Einträge), Pagination
nicht nötig. Falls in Zukunft >100 Modelle aktiv sind, kommt
?limit=/?after= analog zu OpenAI.
Caching
Antworten ändern sich selten (≤ein Update pro Woche). Wir empfehlen clientseitiges Caching mit TTL = 1 Stunde. Bei Modell-Wechseln gibt es kein Push — Clients sollen nach 401/404 die Liste erneut laden.