> bits_and_friends _

$ cat /blog/2026-05-27-datenqualitaet-durch-ki-gestuetzte-standardisierung.de.md

Datenqualität durch KI-gestützte Standardisierung — kleine Effekte, große Wirkung

[de] [en]

In jeder ERP-Auswertung, jeder BI-Aufstellung, jedem Reporting taucht früher oder später dieselbe Frage auf: „Sind diese Zahlen verlässlich?” Die Antwort lautet meistens: „So verlässlich, wie die Stammdaten dahinter.” Und Stammdaten sind in den meisten mittelständischen Unternehmen das, was am wenigsten gepflegt wird — weil Pflege Zeit kostet und niemand direkt davon profitiert.

KI ändert die Ökonomie dieser Pflege.

Wo Datenqualität entsteht — und wo sie kippt

Datenqualität entsteht nicht durch ein einmaliges Aufräumen, sondern durch die fortlaufende Sorgfalt bei jedem neuen Vorgang. Wenn beim Anlegen eines neuen Kunden das Feld „Branche” leer gelassen oder mit „Sonstiges” gefüllt wird, ist die spätere Auswertung nach Branchenverteilung wertlos. Wenn ein Lieferant dreimal mit leicht unterschiedlicher Schreibweise im System steht, ist die Aussage „Top-10-Lieferanten” irreführend.

Diese kleinen Fehler entstehen nicht aus Nachlässigkeit, sondern aus Eile. Niemand legt freiwillig schlechte Daten an — aber unter Zeitdruck wird der Anlageprozess gekürzt, und das fehlende Feld bleibt eben leer.

Wie KI die Eile auffängt

KI kann an drei Stellen ohne großen Aufwand qualitätssichernd wirken:

  • Beim Anlegen: Wenn ein neuer Kunde, Lieferant oder Artikel angelegt wird, schlägt die KI fehlende Felder vor — basierend auf bereits vorhandenen Informationen (Name, Adresse, Web-Domain). Branche aus dem Firmennamen, USt-ID aus dem öffentlichen Register, Ansprechpartner aus der Signatur der ersten E-Mail. Der Bearbeiter prüft und übernimmt.
  • Beim Erkennen: Wenn ein Beleg eintrifft, der zu einem bereits existierenden Lieferanten gehört (in leicht anderer Schreibweise), wird er dem korrekten Stammdatensatz zugeordnet — statt einen neuen anzulegen. Dubletten werden gar nicht erst erzeugt.
  • Beim Auffrischen: Periodisch werden die Stammdaten gegen externe Quellen abgeglichen — Handelsregister, USt-ID-Datenbank, Postleitzahlen-Register. Veraltete oder fehlerhafte Daten werden zur Aktualisierung vorgeschlagen.

In allen drei Fällen ist die KI vorschlagend, der Mensch entscheidet. Aber die Last der Vorschlagserstellung — die heute fast immer beim Anwender liegt — verschwindet.

Was sich konkret messen lässt

In Projekten, die wir begleitet haben, ändern sich folgende Metriken in den ersten sechs Monaten messbar:

  • Anteil vollständig befüllter Stammdatensätze: typischer Sprung von 50–60 % auf >90 %.
  • Anteil Duplikate in Kunden- und Lieferantenstamm: Rückgang von 5–15 % auf <1 %.
  • Anteil korrekt klassifizierter Belege: Steigerung von ca. 70 % auf >95 %.
  • Aufwand für „Datenkorrektur” in der Monats-/Quartalsabschlussvorbereitung: Reduktion um 50–70 %.

Die letzten beiden Zahlen sind die, die im Unternehmen ankommen — die Abschluss-Vorbereitung wird ruhiger, das Reporting verlässlicher, und niemand verbringt mehr ganze Tage damit, Inkonsistenzen aus den Daten zu klären.

Welche Voraussetzungen wirklich nötig sind

Die ehrliche Liste der Voraussetzungen ist kürzer als oft angenommen:

  • Zugriff auf die Datenquellen. Die KI muss in Stammdaten lesen und schreiben dürfen — über offizielle Schnittstellen, nicht über UI-Automatisierung.
  • Definierte Soll-Felder. Welche Felder müssen wirklich gefüllt sein? Welche dürfen leer bleiben? Diese Frage muss einmal beantwortet werden — sie wurde es vorher meist nie.
  • Verantwortlichkeit für Freigaben. Wer entscheidet bei strittigen Vorschlägen (etwa: ist das wirklich derselbe Lieferant oder ein anderer)? Diese Rolle existiert oft schon, aber sie ist nicht explizit benannt.

Was nicht nötig ist: ein riesiges Master-Data-Management-Projekt mit eigener Software. KI-gestützte Datenqualität setzt auf den bestehenden Systemen auf und macht sie besser — sie ersetzt sie nicht.

Wo Vorsicht angebracht bleibt

Bei aller Begeisterung: drei Punkte verlangen menschliches Augenmaß.

  • Automatische Korrekturen ohne Quittung. Wenn die KI Daten ohne Audit-Spur überschreibt, weiß später niemand mehr, was sie geändert hat. Jede Änderung muss dokumentiert sein.
  • Anpassungen ohne Versionierung. Stammdaten haben eine Historie — Adressänderung, Namenswechsel, Rechtsformwechsel. Die KI darf nicht die Historie überschreiben, sondern muss die alte Version aufbewahren.
  • Externe Datenquellen als alleinige Wahrheit. Wenn ein externer Datenbank-Service eine andere Anschrift hat als der Stammsatz, ist nicht immer der externe Service korrekt. Manchmal sind unsere Daten aktueller. Vorschlag ja — Übernahme nur nach Prüfung.

Was am Ende sichtbar wird

Datenqualität ist eines der wenigen Themen, bei denen sich die Investition mit der Zeit überproportional auszahlt. Jede gute Auswertung, jede gute Entscheidung, jede gute KI-Anwendung im Unternehmen setzt darauf auf. Wer hier früh konsistent wird, hat in zwei Jahren eine ganz andere Basis — und es kostet ihn nicht mehr Aufwand, sondern weniger.

KI macht aus einer mühsamen, oft vernachlässigten Hintergrundtätigkeit eine fast unsichtbare, aber wirksame Begleitung der täglichen Arbeit. Das ist nicht spektakulär — aber es ist nachhaltig.