Wissens-Rack (R-A-G)

Eigene Dokumente hochladen und Antworten daraus belegen lassen — tenant-isolierte Retrieval-Augmented Generation auf EU-Infrastruktur.

Das Wissens-Rack ist die durchsuchbare Dokumentensammlung einer Organisation. Technisch ist es R-A-G (Retrieval-Augmented Generation): Vor der Antwort durchsucht SovrGPT Ihre eigenen Dokumente, reicht die passenden Stellen ans Modell und belegt die Antwort mit Quellen. Die Metapher: ein „Regal", in das Ihr Team seine Dokumente stellt, damit das Modell darauf zugreifen kann.

Was es kann

Eigene Dokumente als Wissensquelle: PDF, Word, Excel, Text, Markdown.
Belegte Antworten: Fundstellen werden zitiert — nachvollziehbar, wichtig für Verwaltung, Recht und Compliance.
Pro Chat steuerbar: Sie entscheiden je Unterhaltung, ob das Rack genutzt wird, nur das Rack, nur Web, oder eine Kombination.
Strikt mandantengetrennt: Eine Organisation sieht niemals das Wissen einer anderen.

Wissensquellen pro Chat wählen

Im Composer wählen Sie die Wissensquelle (R-A-G:-Pille). Es gibt fünf Modi:

Modus	Verhalten
Aus	Kein Wissens-Rack — normaler Chat.
Wissens-Rack	Antworten mit Ihrem Wissens-Rack anreichern.
Nur Wissens-Rack	Ausschließlich aus dem Rack antworten (kein Weltwissen).
Web	Nur Web-Suche, ohne Wissens-Rack.
Rack + Web	Wissens-Rack und Web-Suche kombinieren.

Die Organisation legt einen Standard-Modus fest; jeder Chat kann ihn überschreiben. „Nur Wissens-Rack" ist ideal, wenn Antworten ausschließlich auf freigegebenen Hausunterlagen beruhen sollen.

Dokumente verwalten

Unter Einstellungen → Wissen (R-A-G):

Dateien hochladen (PDF/Word/Excel/Text/Markdown). Der Text wird extrahiert, in Abschnitte zerlegt, in Vektoren umgewandelt und gespeichert.
Dokumentenliste einsehen, einzelne Dokumente löschen.
Quota im Blick behalten (Anzahl Dokumente und Gesamtgröße).

Inhalte werden verschlüsselt in der EU gespeichert und bleiben auf diese Organisation beschränkt.

Wie die Suche funktioniert

SovrGPT kombiniert zwei Verfahren und ordnet die Treffer anschließend neu:

Hybrid-Suche — Keyword (Postgres-Volltext) und semantische Vektor-Suche (pgvector) werden zusammengeführt.
Reranking — ein Cross-Encoder (bge-reranker-base) sortiert die besten Treffer nach tatsächlicher Relevanz.
Injektion + Zitat — die Top-Stellen gehen ins Modell, die Antwort verweist auf die Fundstellen.

Embedding und Reranking laufen auf EU-souveränen Endpunkten — kein Hyperscaler, keine Daten außerhalb der EU.

Tenant-Isolation (nicht verhandelbar)

Strikte Trennung pro Organisation ist die Kern-Anforderung des Features:

org_id auf jeder R-A-G-Tabelle — kein Datensatz ohne Organisation.
Row Level Security: Lesen nur für Mitglieder der Organisation; Schreiben ausschließlich serverseitig (nie direkt vom Client).
Verschlüsselte Ablage in EU-Rechenzentren.

Verfügbarkeit (Tarife)

Funktion	Ab Tarif
Wissens-Rack hochladen & abrufen (R-A-G)	Pro
Web-Suche als Quelle	alle Tarife

Reicht das Tier nicht aus, zeigt die R-A-G:-Pille einen Upgrade-Hinweis.

Abgrenzung: Rack vs. Datei-Anhang

Wissens-Rack = persistente Wissensbasis der Organisation, über alle Chats hinweg durchsuchbar.
Datei-Anhang im Chat = flüchtig: eine Datei wird nur für die laufende Unterhaltung berücksichtigt und nicht dauerhaft indexiert.

Verwandte Themen: Marketplace · Eigene Systeme anbinden · DSGVO & Compliance.