Was sind schmutzige Daten?

Schmutzige Daten ist ein Begriff, der verwendet wird, um jegliche Art von elektronischen Daten zu beschreiben, die veraltet, unvollständig oder auf andere Weise nicht korrekt sind. Daten dieses Typs können aufgrund von Fehlern bei der Dateneingabe, aufgrund von Fehlern bei der regelmäßigen Aktualisierung der Daten oder aufgrund der mehrfachen Eingabe derselben Daten erstellt werden. Manchmal sind die falschen Daten nichts anderes als Satzfehler im Text elektronischer Dokumente. In anderen Fällen können schmutzige Daten Informationen sein, die absichtlich irreführend sind, z. B. Versuche, Buchhaltungsunterlagen zu ändern, um Anlegern und anderen ein bestimmtes Image zu präsentieren.

Die Anhäufung von unsauberen Daten in jeder Art von Datenbank ist größtenteils unbeabsichtigt. Personen, die neue Informationen in die Datenbank eingeben, können Wörter falsch schreiben, Satzzeichen auslassen, die für das Verständnis der Intention von Text wichtig sind, oder eine bestimmte Formatierungsstrategie nicht befolgen. In solchen Situationen ist das Korrigieren der falschen Informationen ein relativ einfacher Vorgang, bei dem lediglich der falsche Text geändert und die Änderungen gespeichert werden müssen. Unternehmen verwalten diesen Prozess manchmal, indem sie die eingegebenen Daten korrigieren und die erforderlichen Aktualisierungen vornehmen.

Schmutzige Daten können auch auftreten, wenn vorhandene Datensätze nicht aktualisiert werden, wenn sich die Informationen ändern. Wenn beispielsweise Vertriebsmitarbeiter beim Auftreten von Personaländerungen bei einem bestimmten Kunden die Kundendateien nicht aktualisieren, sind diese Dateien nicht mehr korrekt und werden als verschmutzt angesehen. Wie bei der Korrektur von Rechtschreib- und Interpunktionsfehlern können Sie die Benutzerfreundlichkeit der Datenbank verbessern, indem Sie sich die Zeit nehmen, veraltete Informationen zu entfernen und durch aktuelle Daten zu ersetzen.

Es gibt Situationen, in denen die Erstellung schmutziger Daten beabsichtigt ist. Unternehmen können sich dafür entscheiden, bestimmte Informationen aus einer Datenbank wegzulassen, um eine bestimmte Vorstellung von den Finanzen zu erhalten, z. B. die Höhe der generierten Einnahmen für einen bestimmten Zeitraum, aber keine Daten einzugeben, die sich auf die Höhe der gesammelten Einnahmen für diesen Zeitraum beziehen Zeitraum. Bei dieser Art von unsauberen Daten sind die angezeigten Informationen zwar korrekt, gelten jedoch als unvollständig.

Bei einigen Arten von unsauberen Daten kann die Entscheidung darin bestehen, sich nicht die Zeit und Mühe zu nehmen, um Korrekturen vorzunehmen. Dies ist häufig der Fall, wenn die inkorrekten Daten keinen Einfluss auf die ordnungsgemäße Funktionsweise des Unternehmens haben oder keine potenziellen Probleme verursachen. Dies bedeutet, dass in nahezu jeder Entität, die eine Art von Datenbank verwaltet, wahrscheinlich zumindest ein wenig fehlerhafte Daten mit anderen aktuellen und genauen Informationen durchsetzt sind.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?