Cosa sono i dati sporchi?
Dati sporchi è un termine usato per descrivere qualsiasi tipo di dati elettronici obsoleti, incompleti o altrimenti non accurati. Dati di questo tipo possono essere creati a causa di errori nell'inserimento dei dati, in caso di mancato aggiornamento dei dati su base regolare o persino dell'inserimento degli stessi dati più di una volta. A volte, i dati errati non sono altro che errori di punteggiatura nel testo dei documenti elettronici. In altri casi, i dati sporchi possono essere informazioni intenzionalmente fuorvianti, come i tentativi di modificare i registri contabili per presentare un'immagine specifica agli investitori e ad altri.
Per la maggior parte, l'accumulo di dati sporchi in qualsiasi tipo di database non è intenzionale. Le persone che stanno inserendo nuove informazioni nel database possono scrivere erroneamente le parole, tralasciare la punteggiatura importante per comprendere l'intento del testo o non seguire una strategia di formattazione specifica. Con situazioni di questo tipo, correggere le informazioni errate è un processo relativamente semplice che non richiede altro che alterare il testo errato e salvare le modifiche. Le aziende a volte gestiscono questo processo revisionando i dati dopo averli inseriti e apportando gli aggiornamenti necessari.
Dati sporchi possono anche verificarsi a causa di un errore nell'aggiornamento dei record esistenti quando le informazioni cambiano. Ad esempio, se i venditori non riescono ad aggiornare i file dei clienti quando si verificano cambiamenti del personale con un determinato cliente, tali file non sono più accurati e sono considerati sporchi. Analogamente alla correzione degli errori di ortografia e punteggiatura, dedicare del tempo alla rimozione di informazioni obsolete e alla loro sostituzione con i dati correnti aiuta ad aumentare l'usabilità complessiva del database.
Ci sono situazioni in cui la creazione di dati sporchi è intenzionale. Le aziende possono scegliere di omettere informazioni specifiche da un database al fine di creare una percezione specifica relativa alle finanze, ad esempio evidenziando l'ammontare delle entrate generate per un determinato periodo, ma scegliendo di non inserire dati relativi all'importo delle entrate raccolte per lo stesso periodo. In questo tipo di dati sporchi, le informazioni presentate sono accurate per quanto possibile, ma sono considerate incomplete.
Con alcuni tipi di dati sporchi, la decisione potrebbe essere quella di non prendere il tempo e gli sforzi per apportare correzioni. Ciò è comune quando i dati errati non hanno alcun impatto sulla capacità dell'azienda di funzionare correttamente o non presentano alcun potenziale per causare gravi difficoltà. Ciò significa che quasi ogni entità che mantiene un qualche tipo di database probabilmente ha almeno un po 'di dati sporchi intervallati da altre informazioni che sono attuali e accurate.