Go to Top

Was bedeutet “data profiling”?

Data profiling – auch Daten Archäologie genannt – ist die statistische Analyse und Bewertung von Datenbeständen (zum Beispiel in einer Datenbank) auf Eindeutigkeit, Konsistenz und Logik.

Der Data-profiling-Prozess kann zwar falsche oder ungenaue Daten nicht identifizieren, aber er kann Verstöße gegen Unternehmensregeln und andere Unregelmäßigkeiten aufdecken. Die durch Data Profiling gewonnenen Erkenntnisse können zeigen, ob und wie vorhandene Daten für andere Zwecke, als die, für die sie ursprünglich gedacht waren verwendet werden können. Data profiling kann auch benutzt werden, um die Datenqualität zu bewerten und festzustellen, ob Metadaten die Quelldaten korrekt oder ungenau beschreiben.

Profiling-Tools bewerten Inhalt, Struktur und Qualität der Daten durch die Untersuchung der Beziehungen zwischen Daten innerhalb von Datensätzen aber auch zwischen unterschiedlichen Datensätzen.

Bildquelle: Jer Thorp / flickr – Lizenz: CC2