Co jsou špinavá data?
Znečištěná data je termín používaný k popisu jakéhokoli typu elektronických dat, který je zastaralý, neúplný nebo jinak nepřesný. Data tohoto typu mohou být vytvořena z důvodu chyb při zadávání údajů, selhání pravidelných aktualizací údajů nebo dokonce zadávání stejných dat více než jednou. Nesprávná data někdy nejsou nic jiného než chyby v interpunkci v textu elektronických dokumentů. V jiných případech mohou být špinavými údaji informace, které jsou záměrně zavádějící, jako například pokusy o úpravu účetních záznamů tak, aby představovaly konkrétní obraz investorům a jiným.
Nahromadění špinavých dat v jakémkoli typu databáze je většinou neúmyslné. Jednotlivci, kteří zadávají nové informace do databáze, mohou chybně hláskovat slova, vynechat interpunkci, která je důležitá pro pochopení záměru textu nebo nedodržují konkrétní strategii formátování. V situacích tohoto typu je oprava nesprávných informací relativně jednoduchým procesem, který nevyžaduje nic jiného než změnu nesprávného textu a uložení změn. Podniky někdy řídí tento proces korekturou dat po jejich zadání a provedením nezbytných aktualizací.
Znečištěná data mohou také nastat kvůli selhání aktualizace existujících záznamů při změně informací. Pokud například prodejci nedokážou aktualizovat zákaznické soubory, když dojde k personálním změnám u daného zákazníka, tyto soubory již nejsou přesné a jsou považovány za špinavé. Stejně jako při opravě pravopisných a interpunkčních chyb, prodloužení doby pro odstranění zastaralých informací a jejich nahrazení aktuálními daty zvyšuje celkovou použitelnost databáze.
Existují situace, kdy je vytváření špinavých dat úmyslné. Společnosti se mohou rozhodnout vynechat konkrétní informace z databáze, aby vytvořily konkrétní vnímání týkající se financí, jako je například zvýraznění výše generovaných příjmů za dané období, ale rozhodnou se nevkládat údaje, které se vztahují k výši shromážděných příjmů za stejné období. doba. V tomto typu špinavých dat jsou informace, které jsou uvedeny, přesné, pokud jde, ale jsou považovány za neúplné.
U některých typů špinavých dat může být rozhodnutí nečinit čas a úsilí k opravám. To je běžné, pokud nesprávná data nemají žádný dopad na schopnost firmy řádně fungovat nebo pokud nepředstavují žádný potenciál pro způsobení velké tísně. To znamená, že téměř každá entita, která udržuje nějaký typ databáze, má pravděpodobně alespoň trochu špinavá data promíchaná s jinými informacemi, které jsou aktuální a přesné.