Datenhygiene: Erklärung und Definition

Datenhygiene sind die kollektiven Prozesse die durchgeführt werden, um die Datensauberkeit zu gewährleisten. Daten gelten als sauber, wenn sie relativ fehlerfrei sind. Schmutzige Daten können durch eine Reihe von Faktoren verursacht werden, darunter doppelte Datensätze, unvollständige oder veraltete Daten und falsche Analyse von Datensatzfeldern aus unterschiedlichen Systemen. Fehler können in jeder Phase bei der Eingabe, Speicherung und Verwaltung von Daten auftreten.

Die Datenqualität ist entscheidend für operative und transaktionale Prozesse im Unternehmen und für die Zuverlässigkeit von Business-Analyse (BA) / Business Intelligence (BI) Berichten.

Datenbereinigung ist der Prozess des Änderns oder Entfernens von Daten aus einer Datenbank, die falsch, unvollständig, fehlerhaft oder dupliziert sind. Der Prozess umfasst in der Regel das Aktualisieren, Standardisieren und Deduplizieren von Datensätzen, um eine einzige Datenansicht zu erstellen, selbst wenn diese in mehreren unterschiedlichen Systemen gespeichert sind.