Wissens-Rack (R-A-G)
Eigene Dokumente hochladen und Antworten daraus belegen lassen — tenant-isolierte Retrieval-Augmented Generation auf EU-Infrastruktur.
Das Wissens-Rack ist die durchsuchbare Dokumentensammlung einer Organisation. Technisch ist es R-A-G (Retrieval-Augmented Generation): Vor der Antwort durchsucht SovrGPT Ihre eigenen Dokumente, reicht die passenden Stellen ans Modell und belegt die Antwort mit Quellen. Die Metapher: ein „Regal", in das Ihr Team seine Dokumente stellt, damit das Modell darauf zugreifen kann.
Was es kann
- Eigene Dokumente als Wissensquelle: PDF, Word, Excel, Text, Markdown.
- Belegte Antworten: Fundstellen werden zitiert — nachvollziehbar, wichtig für Verwaltung, Recht und Compliance.
- Pro Chat steuerbar: Sie entscheiden je Unterhaltung, ob das Rack genutzt wird, nur das Rack, nur Web, oder eine Kombination.
- Strikt mandantengetrennt: Eine Organisation sieht niemals das Wissen einer anderen.
Wissensquellen pro Chat wählen
Im Composer wählen Sie die Wissensquelle (R-A-G:-Pille). Es gibt fünf Modi:
| Modus | Verhalten |
|---|---|
| Aus | Kein Wissens-Rack — normaler Chat. |
| Wissens-Rack | Antworten mit Ihrem Wissens-Rack anreichern. |
| Nur Wissens-Rack | Ausschließlich aus dem Rack antworten (kein Weltwissen). |
| Web | Nur Web-Suche, ohne Wissens-Rack. |
| Rack + Web | Wissens-Rack und Web-Suche kombinieren. |
Die Organisation legt einen Standard-Modus fest; jeder Chat kann ihn überschreiben. „Nur Wissens-Rack" ist ideal, wenn Antworten ausschließlich auf freigegebenen Hausunterlagen beruhen sollen.
Dokumente verwalten
Unter Einstellungen → Wissen (R-A-G):
- Dateien hochladen (PDF/Word/Excel/Text/Markdown). Der Text wird extrahiert, in Abschnitte zerlegt, in Vektoren umgewandelt und gespeichert.
- Dokumentenliste einsehen, einzelne Dokumente löschen.
- Quota im Blick behalten (Anzahl Dokumente und Gesamtgröße).
Inhalte werden verschlüsselt in der EU gespeichert und bleiben auf diese Organisation beschränkt.
Wie die Suche funktioniert
SovrGPT kombiniert zwei Verfahren und ordnet die Treffer anschließend neu:
- Hybrid-Suche — Keyword (Postgres-Volltext) und semantische Vektor-Suche (pgvector) werden zusammengeführt.
- Reranking — ein Cross-Encoder (
bge-reranker-base) sortiert die besten Treffer nach tatsächlicher Relevanz. - Injektion + Zitat — die Top-Stellen gehen ins Modell, die Antwort verweist auf die Fundstellen.
Embedding und Reranking laufen auf EU-souveränen Endpunkten — kein Hyperscaler, keine Daten außerhalb der EU.
Tenant-Isolation (nicht verhandelbar)
Strikte Trennung pro Organisation ist die Kern-Anforderung des Features:
org_idauf jeder R-A-G-Tabelle — kein Datensatz ohne Organisation.- Row Level Security: Lesen nur für Mitglieder der Organisation; Schreiben ausschließlich serverseitig (nie direkt vom Client).
- Verschlüsselte Ablage in EU-Rechenzentren.
Verfügbarkeit (Tarife)
| Funktion | Ab Tarif |
|---|---|
| Wissens-Rack hochladen & abrufen (R-A-G) | Pro |
| Web-Suche als Quelle | alle Tarife |
Reicht das Tier nicht aus, zeigt die R-A-G:-Pille einen Upgrade-Hinweis.
Abgrenzung: Rack vs. Datei-Anhang
- Wissens-Rack = persistente Wissensbasis der Organisation, über alle Chats hinweg durchsuchbar.
- Datei-Anhang im Chat = flüchtig: eine Datei wird nur für die laufende Unterhaltung berücksichtigt und nicht dauerhaft indexiert.
Verwandte Themen: Marketplace · Eigene Systeme anbinden · DSGVO & Compliance.