Co jsou špinavá data?
Dirty Data je termín používaný k popisu jakéhokoli typu elektronických dat, který je zastaralý, neúplný nebo jinak přesný. Data tohoto typu mohou být vytvořena kvůli chybám při zadávání dat, neschopnost pravidelně aktualizovat data nebo dokonce zadání stejných dat více než jednou. Nesprávná data občas nejsou ničím jiným než chybami při interpunkci v textu elektronických dokumentů. V jiných případech mohou špinavá data být informace, které jsou záměrně zavádějící, jako jsou pokusy o úpravu účetních záznamů tak, aby investory a dalším představily konkrétní obrázek.
Z velké části je hromadění špinavých dat v jakémkoli typu databáze neúmyslná. Jednotlivci, kteří do databáze zadávají nové informace do databáze, mohou chytit slova, vynechat interpunkci, která je důležitá pro pochopení záměru textu, nebo nedodrží konkrétní strategii formátování. Se situacemi tohoto typu je oprava nesprávných informací relativně jednoduchý procesTo nevyžaduje nic jiného než změnu nesprávného textu a uložení změn. Podniky někdy spravují tento proces tím, že po zadání a provedení nezbytných aktualizací.
Dirty Data mohou také nastat v důsledku selhání aktualizace stávajících záznamů, když se změní informace. Například, pokud prodejci nedokážou aktualizovat soubory zákazníků, když dojde ke změnám personálu u daného zákazníka, tyto soubory již nejsou přesné a jsou považovány za špinavé. Stejně jako při opravě pravopisu a interpunkčních chyb, udělení času na odstranění zastaralých informací a jejich nahrazení aktuálních dat pomáhá zvýšit celkovou použitelnost databáze.
Existují situace, kdy je vytváření špinavých dat úmyslná. Společnosti se mohou rozhodnout vynechat konkrétní informace z databáze, aby vytvořily konkrétní vnímání o financích, jako je zvýraznění množství GENeroté příjmy za dané období, ale rozhodl se nezadat data, která se týkají výše shromážděných příjmů za stejné období. V tomto typu špinavých dat jsou prezentované informace přesné, pokud jde o to, ale jsou považovány za neúplné.
S některými typy špinavých dat může být rozhodnutím, že nebudete mít čas a úsilí k provedení oprav. To je běžné, když nesprávná data nemají žádný dopad na schopnost podniku správně fungovat nebo nepředstavují žádný potenciál způsobit žádnou velkou úzkost. To znamená, že téměř jakákoli entita, která udržuje nějaký typ databáze, má pravděpodobně alespoň trochu špinavých dat rozptýlených s jinými informacemi, které jsou aktuální a přesné.