Was ist Data Quality?
Data Quality ist, wenn Daten dem Zweck entsprechen, für den sie bestimmt waren. Daten gelten auch dann als hochwertig, wenn sie reale Konstrukte genau wiedergeben.
Um dies zu verstehen, müssen Sie Daten als Grundstein einer darauf aufbauenden Hierarchie betrachten. Über diesen Grundstein erhalten Sie Informationen – Daten, die in einen Kontext gestellt werden. Aus verwertbaren Informationen entsteht Wissen, das sich bei seiner Anwendung zu Weisheit entwickelt. Qualitativ schlechte Daten führen zu einer schlechten Informationsqualität, was in der Hierarchie nach oben bewegt und zu schlechten Geschäftsentscheidungen führt.
Wenn Daten einem bestimmten Zweck dienen und reale Konstrukte darstellen, gelten sie als qualitativ hochwertig. Dies kann jedoch auch widersprüchlicher Natur sein.
Nehmen Sie zum Beispiel den Stammdatensatz eines Kunden, der ein Produkt des Unternehmens verwendet. Die Daten im Stammsatz können ausreichen, um dem Kunden eine Rechnung auszustellen, wenn jedoch genaue Angaben zu Adresse und Telefonnummer fehlen, steht der Kundendienst möglicherweise vor einem Problem, das sich auf das gesamte Geschäft auswirken kann.
Im Idealfall sollte der Stammdatensatz mehreren Zwecken dienen. Dazu ist eine reale Ausrichtung erforderlich, bei der die Daten ihrem Zweck entsprechen und auch für andere Geschäftsziele verwendet werden können. Dies sollte ohne einen unverhältnismäßigen Bedarf an Ressourcen zur Datenerhebung erfolgen. Anders ausgedrückt: Die beiden Aspekte der Definition der Data Quality müssen ausgewogen sein.
Menschliches Versagen steht ganz oben auf der Liste der Ungenauigkeiten, die zu qualitativ schlechten Daten führen. Die Korrektur von Daten schlechter Qualität ist zeitaufwändig, erfordert enorme Anstrengungen und eine ideale Kombination aus Mitarbeitern, besseren Prozessen und Technologien. Andere Gründe für eine schlechtere Data Quality sind mangelnde Kommunikation zwischen den Abteilungen und unzureichende Datenstrategien. Die Probleme können nur mit einem proaktiven Management gelöst werden.

Bedeutung der Data Quality
In der gesamten Hierarchie eines Unternehmens besteht kein Zweifel daran, dass qualitativ hochwertige Daten sich auf das Ergebnis auswirken. Es bleibt jedoch die Frage, wer dafür verantwortlich ist, dass die Qualität der Daten konstant gut ist und wie diese Bemühungen in einer Organisation finanziert werden. Die Datenqualität muss minütlich getestet werden, um positive oder negative Auswirkungen auf ein Unternehmen zu erkennen. Dieser Prozess kann relativ komplex sein. Die folgenden Beispiele zeigen, wie wichtig Protokolle für die Sicherstellung der Datenqualität sind:
- In der Marketingabteilung Ihres Unternehmens können doppelte Datensätze zur Überschreitung Marketingbudgets führen. Eine Datenbank kann beispielsweise Marketingmaterialien mit geringfügigen Abweichungen im Namen des potenziellen Kunden erhalten. Dies kann nicht nur den Kunden frustrieren, sondern auch zu vollständigen Verdopplungen von Kundenprofilen führen.
- Die Online-Verkaufsabteilung kann eine Agenda für die Schaffung einer Selbstbedienungs-Kaufentscheidung vorantreiben. Die Data Quality kann aufgrund unvollständiger Produktdaten in vorhandenen Datenbanken und der Art und Weise, wie Produktdaten zwischen Produktpartnern syndiziert werden,eine schwierige Aufgabe werden.
- Für die Lieferkette, in der Sie möglicherweise Prozesse automatisieren möchten, ist es schwierig, zuverlässige Standortdaten zu erhalten, da nicht für alle zu bedienenden Standorte dieselben Standards und dieselbe Genauigkeit gelten können.
- In Abteilungen, die auf die Finanzberichterstattung angewiesen sind, ist das Problem einer Vielzahl von Antworten auf eine einzelne Frage auf inkonsistente Daten, fehlende aktualisierte Daten oder Mangel an klaren Datenparametern zurückzuführen.
All dies zusammen hat drastische negative Auswirkungen auf die unternehmerischen Aspekte eines Unternehmens und erschwert das Erreichen der Unternehmensziele. Die meisten dieser Ziele sind in einer Vielzahl von Unternehmen anzutreffen.
Ohne gute Data Quality werden Unternehmen:
- nicht in der Lage, neue Marktchancen zu nutzen. Dies kann ihre Gewinnspanne beeinträchtigen und ihren Wachstumskurs behindern.
- nicht in der Lage sein, Maßnahmen zur Kostensenkung einzuleiten. Aufgrund des Mangels an qualitativ hochwertigen Daten müssen viele manuelle Prüfungen und Korrekturen durchgeführt werden, bevor sie verwendet werden können. Die Automatisierung von Prozessen wird dann ohne vollständige und konsistente Daten schwierig.
- nicht in der Lage sein, Compliance-Anforderungen einzuhalten, da dies ohne qualitativ hochwertige Daten immer schwieriger wird. Die Anforderungen umfassen Aspekte wie Datenschutz- und Datenschutzbestimmungen sowie Gesundheits- und Sicherheitsanforderungen. Das gilt auch für Aspekte finanzieller Beschränkungen und Richtlinien. Gute Datenqualität ist für das Erreichen der Compliance-Ziele von entscheidender Bedeutung.
- Schwierigkeiten haben, Tools zur prädiktive Analyse für Unternehmensdatenbestände zu verwenden. Dies kann sowohl kurzfristige als auch langfristige Entscheidungen beeinflussen und Fortschritte für Unternehmen erheblich behindern. Die Herausforderungen ergeben sich aus Problemen wie Datenduplizierung, unvollständigen Daten, Inkonsistenz sowie Ungenauigkeit von Vorhersagen.

Die Vorteile von qualitativ hochwertigen Daten
Unternehmen, die in die Erstellung hochwertiger Daten investieren, können Daten nutzen, um bessere Geschäftsentscheidungen zu treffen.
Qualitativ hochwertige Daten ermöglichen bessere Entscheidungen
Der moderne Markt ist natürlich verbraucherorientiert. Mit qualitativ hochwertigen Daten können Unternehmen bessere Entscheidungen treffen. Wenn beispielsweise eine Datenanalyse zeigt, dass die Menschen donnerstags zunehmend mehr Zeit im Freien verbringen, einkaufen und essen, als am üblichen Freitag, können Unternehmen sich entscheiden, ob sie länger geöffnet bleiben oder einzigartige Angebote zur Verfügung stellen, um ihr Geschäft zu fördern.
Bessere Zusammenarbeit im Team
Wenn die vielen Abteilungen einer Organisation ständigen Zugriff auf dieselben qualitativ hochwertigen Daten haben, ist das Ergebnis eine weitaus bessere und effektivere Kommunikation. Dies erleichtert allen Teammitgliedern, in Bezug auf Prioritäten, das ausgehende Messaging sowie das Branding auf dem Laufenden zu bleiben. Das alles zusammen führt zu besseren Ergebnissen.
Besseres Verständnis des Kunden
Mit qualitativ hochwertigen Daten können Unternehmen die Interessen und Anforderungen der Kunden besser einschätzen. Dies hilft einem Unternehmen beim Wachstum, da es bessere Produkte entwickeln kann, die sich an den Bedürfnissen seiner Kunden orientieren. Die erstellten Kampagnen können dann auf der Grundlage von Verbraucherwünschen und direktem Feedback aus Daten durchgeführt werden, nicht nur auf fundierten Vermutungen.
Wie beurteilen Sie die Data Quality?
Angesichts der Tatsache, dass Unternehmen erheblich verlieren werden, wenn Geschäftsprozesse auf qualitativ schlechte Daten basieren, müssen Eigentümer und Manager verstehen, wie die Data Quality bewertet werden kann. Diese Aufgabe umfasst die Bereitstellungen von Metriken und Prozessen zur Bewertung der Data Quality. Unternehmen müssen daran arbeiten, dass ihre Daten sowohl für objektive als auch für subjektive Bewertungen einen hohen Rang erreichen. Damit Unternehmen die Data Quality verbessern können, müssen sie:
- sowohl objektive als auch subjektive Data Quality-Metriken bewerten
- die Ergebnisse analysieren und die Ursachen für etwaige Abweichungen ermitteln
- an Verbesserungsmöglichkeiten arbeiten
Subjektive Datenbewertungen
Mit subjektiven Bewertungen messen Unternehmen, wie Stakeholder, Datenspezialisten, Sammler und andere Parteien die Qualität der Daten wahrnehmen. Wenn einer der Stakeholder auf der Grundlage der erhaltenen ungenauen oder unvollständigen Daten eine Entscheidung trifft, wird seine Entscheidung beeinflusst. Dies muss bei der Suche nach Schlupflöchern in der Data Quality berücksichtigt werden.
Objektive Datenbewertungen
Objektive Data-Quality-Bewertungen betrachten messbare Indikationen, die innerhalb eines Datensatzes erfasst und anschließend aus zwei Perspektiven bewertet werden:
- seine Performance innerhalb einer bestimmten Aufgabe
- unter dem Gesichtspunkt, dass es sich um einen metrikbasierten Datensatz handelt, der unabhängig verwendet werden kann
Zur Festlegung dieser Metriken für die Bewertung objektiver Daten können Unternehmen Grundsätze für die Entwicklung von Leistungsindikatoren (Key Performance Indicators, KPIs) erarbeiten, die ihren spezifischen Bedürfnissen entsprechen. Sie werden als Funktionsformen bezeichnet. Es gibt drei Möglichkeiten, wie die Qualität von Funktionsformen gemessen werden kann:
- Einfaches Verhältnis: Hier wird die Gesamtzahl der gewünschten Ergebnisse an der Gesamtzahl der möglichen Ergebnisse gemessen. Der Bereich liegt im allgemeinen zwischen 0 und 1, wobei 1 das am meisten bevorzugte Ergebnis ist. Mit diesem Verhältnis können sowohl Vollständigkeit als auch Konsistenz gemessen werden. Der Haken dabei ist, dass beide Dimensionen auf verschiedene Arten gemessen werden können und Unternehmen Kriterien festlegen müssen, um die besten Maßnahmen zu ermitteln.
- Minimum oder Maximum: Diese Funktionsform wurde für die Verarbeitung mehrerer Data-Quality-Variablen entwickelt. Das Minimum ist eine konservative Zahl, das Maximum ein liberaleren Zahl. Die Variablen, wie der genaue Datenstand, sind durch Minimum gekennzeichnet. Aspekte wie Aktualität oder/und Zugänglichkeit werden mit dem Maximum abgebildet.
- Gewichteter Durchschnitt: Wird als Alternative zum Minimum verwendet und kann verwendet werden, wenn ein Unternehmen versucht, den Wert, den jede Variable in die Gleichung einbringt, zu untersuchen und zu verstehen.
Wenn ein Unternehmen alle objektiven und subjektiven Data-Quality-Metriken bewertet hat, kann es Maßnahmen ergreifen, die zur Rationalisierung seiner Prozesse beitragen. Prozesse zu prüfen und objektive Entscheidungen zu treffen, ist verschwendete Zeit, wenn die getroffenen Maßnahmen nicht wirksam sind und konsequent durchgeführt werden.
Verbesserung der Data Quality
Für jedes Unternehmen geht es bei der Verbesserung der Data Quality um die richtige Mischung aus qualifizierten Mitarbeitern, intelligenten Prozessen und genauen Technologien. All dies, kombiniert mit einem proaktiven Management auf oberster Führungsebene, kann dazu beitragen, die Data Quality erheblich zu verbessern.
Dimensionen der Data Quality
Bei der Verbesserung der Data Quality besteht die Hauptaufgabe darin, das Spektrum der Data-Quality-Dimensionen zu verbessern. Die am häufigsten angesprochene Dimension ist die der Eindeutigkeit der Kundenstammdaten. In dieser Datenbank kommt es häufig zu Duplikaten, wenn zwei oder mehr Eingabezeilen die gleichen Daten einer Entität (des Kunden) enthalten. Es gibt zahlreiche Möglichkeiten, um sicherzustellen, dass Daten nicht dupliziert werden — sowohl bei der Eiungabe als auch durch Deduplizierungstechniken von bereits in Datenbanken enthaltenen Daten.
Bei Produktstammdaten ist die Dimension der Eindeutigkeit kein großes Problem. Es ist vielmehr die Vollständigkeit. Der Hauptgrund für die mangelnde Vollständigkeit ist, dass verschiedene Produktkategorien unterschiedliche Anforderungen haben und nicht alle ausgefüllt sind. In vielen Fällen steht die Konformität der Produktdaten in direktem Zusammenhang mit Standorten, beispielsweise Maßeinheiten. Während die USA die Länge in Zoll messen, misst der Rest der Welt in Zentimetern.
Bei der Arbeit mit den Stammdaten der einzelnen Standorte entsteht das Problem, dass es keine einheitliche Eingabemaske gibt. Bei so vielen unterschiedlichen Formaten, die auf der ganzen Welt verwendet werden, kann die Standardisierung von Eingaben äußerst schwierig sein.
An Kreuzungen zu berücksichtigende Aspekte
Irgendwann werden sich Standort- und Kundendomänen überschneiden und die Dimension der Präzision wird schwer aufrechtzuerhalten sein. Das liegt daran, dass verschiedene Anwendungsfälle unterschiedliche Präzisionsdimensionen für die Lokalisierung nutzen.
Um diese Überschneidung erfolgreich durchführen zu können, ist es wichtig, die Kundenwünsche zu verstehen, auf deren Grundlage relevante Details eines Produkts mit ihnen geteilt werden können. Dies hilft bei der Überschneidung von Kunden- und Produktstammdatenbereichen.
Sechs Hauptdimensionen als Grundlage für Datenqualitätsstandards
Diese Standards können sich von Projekt zu Projekt unterscheiden, ihre Grundlage sollte jedoch allgemein gleich bleiben. Qualitativ hochwertige Daten unterliegen immer den folgenden sechs Grundstandards:
- Vollständigkeit: Prüfen Sie, welche wichtigen Felder ausgefüllt werden müssen, damit ein Datensatz als vollständig gilt. Im Falle einer Kundendatenbank sind Name und Adresse ein absolutes Muss, das Geschlecht aber je nach Produkt oder Dienstleistung möglicherweise nicht. Zunehmend wird die Entfernung von Herr/Frau angesprochen, um nicht nur die Personen zu berücksichtigen, die sich diesen Kategorien nicht zugehörig fühlen, sondern weil diese Angabe nicht notwendig ist.
- Konsistenz: Stellen Sie sicher, dass alle Iterationen von Daten in allen erstellten und verwendeten Berichten, Analyseergebnissen oder Tabellenkalkulationen identisch sind. Achten Sie auf Inkonsistenzen, denn sie können in Zukunft zu qualitativ schlechten Daten führen. Gute Software sollte dabei helfen, Inkonsistenzen zu beseitigen oder zu erkennen.
- Genauigkeit: Konsistenz ist erforderlich, um einen einzelnen Wert über alle Kanäle hinweg sicherzustellen. Bei der Genauigkeit hingegen geht es darum, dass diese Werte korrekt sind und die Realität abbilden, die die Daten darstellen. Wenn das problematisch ist, kann die Verwendung von Robotik zur Dateneingabe menschliche Fehler beseitigen.
- Format: Die Sicherstellung, dass die Dateneingabeformate konsistent sind, muss der Eckpfeiler der Dateneingabe sein. Erstellen Sie ein einzigartiges Format und halten Sie sich daran, auch bei kleinsten Details wie dem Herstellungsjahr. Amerikanisches oder englisches Datumsformat? Alles groß geschrieben?
- Zeitraum: Die Effektivität von Daten hängt davon ab, wie aktuell und relevant sie zum Zeitpunkt sind, an dem sie für die Verwendung durch den Endbenutzer abgerufen werden. Wenn die Daten aktuell sind, den Entscheidungsträgern zur richtigen Zeit zur Verfügung stehen und die aktuellste Version von sich selbst sind, ist die Aktualität sichergestellt.
- Integrität: Mit diesem Kriterium wird festgestellt, ob ein Datensatz den von der Organisation festgelegten Regeln und Standards entspricht. Fehlende Werte können die Wirksamkeit von Daten beeinträchtigen.
Wenn sichergestellt wird, dass diese Dimensionen eindeutig eingehalten werden, erhalten Unternehmen Datensätze, die genau, qualitativ hochwertig und für eine qualitativ hochwertige Entscheidungsfindung unverzichtbar sind.