RAG & Unternehmenswissen
Wir machen internes Wissen aus Dokumenten, Tickets, Wikis, Mails und Filesystems durch KI auffindbar, nutzbar und nachvollziehbar. Statt einem reinen Sprachmodell, das antwortet „wie es klingen muss", liefern wir RAG-Systeme, die antworten „wie es bei Ihnen wirklich dokumentiert ist" — mit Quellenbezug, Zugriffskonzept und Audit-Trail.
Für wen, welches Problem, welches Ergebnis
Unternehmen mit gewachsener Dokumentation, deren Wissen in Confluence, SharePoint, Nextcloud, Filesystem, E-Mail-Postfächern und Ticket-Historien verstreut ist. Wo neue Kolleg:innen monatelang in den Sucharbeiten verloren gehen und alte Hasen die einzigen sind, die wissen, wo „der eine Test-Bericht von 2018" liegt. Ergebnis: schnelleres Auffinden von Wissen, kürzere Einarbeitung neuer Mitarbeitender, geringere Abhängigkeit von Einzelpersonen, bessere Entscheidungsgrundlagen mit nachvollziehbarem Quellenbezug.
Typische Einsatzfälle
- RAG-Systeme über Confluence, SharePoint, Nextcloud, Filesystem als unified Knowledge-Layer
- Intelligente Dokumentensuche mit Quellenbezug — der Agent zitiert, woher er die Antwort hat
- Wissensassistenten für Service-Desk, Onboarding, HR, Engineering
- Zugriffskonzepte — der Agent zeigt nur, was die anfragende Person sehen darf
- Quellenbezug und Versions-Awareness — keine Antwort aus veralteter Doku ohne Hinweis
- Indexierung heterogener Datenquellen (PDFs, DOCX, Markdown, HTML, E-Mail-Threads, Ticket-Verläufe)
- Datenaufbereitung — OCR für gescannte Dokumente, Tabellen-Extraktion, Metadaten-Anreicherung
- Integration in Chat-Frontends, Portale, Service-Desk-Tools und interne Anwendungen
Vorgehen
- Wissens-Landschaft kartieren — wo liegt was, in welcher Qualität, mit welcher Aktualität? Welche Quellen sind dauerhaft, welche temporär? Wer darf was sehen?
- Pilot-Use-Case wählen — wir starten typischerweise mit Service-Desk oder Onboarding, weil dort Wirkung sofort messbar ist und Daten reichlich vorhanden.
- Indexierung & Vector-Store — Chunking-Strategien, Embeddings (lokal oder API), Vector-Store (pgvector, Qdrant, Weaviate) inkl. Rechte-Sicherung.
- RAG-Architektur — Query-Reformulierung, Hybrid-Search (BM25 + Vector), Re-Ranking, Antwort-Synthese mit Pflichtzitaten, Halluzinations-Schranken.
- Betrieb & Qualität — Eval-Set aus typischen Anfragen, kontinuierliche Bewertung, Update-Pipeline für neue Dokumente, Drift-Alarm bei verschlechterter Recall.
Tech-Stack
Deliverables
- RAG-System mit Quellenbezug, Zitierpflicht und Halluzinations-Schranken
- Indexierungs-Pipeline mit Update-Strecken für neue/geänderte Dokumente
- Zugriffsmodell, das ACLs aus Confluence/SharePoint/Filesystem respektiert
- Eval-Suite (Recall, Precision, Answer-Faithfulness) inkl. Regressions-Tests
- Frontend-Integration (Web-Chat, MS Teams, Slack, oder Embed in interner App)
- Betriebs-Runbook inkl. Doku-Pflege und Drift-Reaktion
Kundennutzen
- Schnelleres Finden von Wissen — Antworten in Sekunden statt Suchstunden
- Bessere Einarbeitung neuer Mitarbeitender — Onboarding-Assistent ist immer verfügbar
- Weniger Abhängigkeit von Einzelpersonen, die „alles wissen"
- Bessere Entscheidungsgrundlagen durch belegte Quellen statt Bauchgefühl
- Nutzbares internes Wissen — was sonst in Ordnern verstaubt, wird wieder gefragt
Compliance & Sicherheit
- ACL-Respekt: der Agent zeigt nur, was die fragende Person ohnehin sehen dürfte
- Lokale Embeddings und Modelle für sensible Daten — keine Übermittlung an Drittanbieter
- Versions-Awareness: Antworten aus veralteter Doku werden markiert oder unterdrückt
- Audit-Log über alle Anfragen — wer hat wann was gefragt, welche Quellen wurden geliefert
- DSGVO-konforme Speicherung von Anfrageprotokollen mit Aufbewahrungsfristen
FAQ
Was ist der Unterschied zu einer Volltextsuche?
Eine Volltextsuche findet exakte Begriffe. RAG findet semantische Treffer — auch wenn der Fragende „Lieferantenrechnung mit Skonto-Logik" sucht und das Dokument von „Eingangsrechnung mit Skontofeld" spricht. Hybrid-Search kombiniert beides, damit weder Synonyme noch exakte Treffer verloren gehen.
Was, wenn unsere Doku schlecht oder veraltet ist?
Dann sehen wir das. RAG zeigt schonungslos, wo Doku Lücken hat oder widersprüchlich ist. Viele Kunden nutzen die Einführungs-Phase gleichzeitig zur Doku-Bereinigung — der Agent unterstützt durch Konflikt-Reports und „häufig gefragt, schlecht beantwortet"-Listen.
Bleibt das alles lokal?
Optional ja. Lokale Embeddings (BGE, E5) und lokale Sprachmodelle (Gemma, Llama, Mistral) auf Ihrer Infrastruktur — kein Datenfluss nach außen. Cloud-APIs verwenden wir nur, wenn DPA und Datenlokalität es erlauben und Sie den Mehrwert wollen.
Wie verhindern Sie Halluzinationen?
Vier Schichten: (1) RAG-Pflicht: jede Antwort braucht mindestens eine Quelle. (2) Zitat-Validierung: der Agent muss zeigen, wo die Aussage steht. (3) Confidence-Schwellen mit Antwort-Verweigerung. (4) Eval-Suite mit Answer-Faithfulness-Score als Regressions-Gate.
Wie lange dauert die Einführung?
Acht bis zwölf Wochen bis zum ersten produktiven RAG-Use-Case (Service-Desk oder Onboarding). Hauptzeit fließt in saubere Indexierung, Rechtemodell und Eval — Halluzinationen in den ersten Wochen würden Vertrauen kosten, daher gehen wir gründlich vor.
Wissens-Use-Case besprechen
Welche Frage wird in Ihrem Unternehmen täglich mehrfach gestellt und müsste eigentlich schon beantwortet sein? Wir prüfen, ob ein RAG-System hier kurzfristig Wirkung zeigt.
> KI-Readiness-Check starten