Qual è la ridondanza dei dati?

La ridondanza dei dati è una situazione che si verifica all'interno dei sistemi di database e comporta la creazione involontaria di dati duplicati che non sono necessari alla funzione del database. Mentre la ridondanza è spesso un tratto desiderabile in alcune situazioni, questo non è vero quando si tratta della funzione di un database. La presenza di dati duplicati può spesso avere un effetto avverso sulla funzione del sistema, con conseguente restituzione di informazioni in risposta a query di sistema che sono meno che utili. Una delle funzioni chiave della gestione dei dati è l'identificazione di dati duplicati e la rimozione di tali duplicazioni.

Il potenziale per la ridondanza dei dati si trova in qualsiasi tipo di programma di database. I programmi considerati piatti, come i fogli di calcolo, e si basano sull'ingresso manuale dei dati sono particolarmente sensibili alla duplicazione di informazioni che possono portare a complicazioni quando si tratta di recuperare le informazioni desiderate. Database in stile relazionale, come le venditeI database di contatto, spesso includono processi che aiutano a ridurre al minimo le possibilità di duplicazione involontaria, come la creazione di due diversi file di contatto sullo stesso contatto associato alla stessa società. Anche con l'uso di controlli di sistema per aiutare a ridurre l'incidenza della ridondanza dei dati, c'è ancora il potenziale per i problemi, rendendo necessario impegnarsi periodicamente nel compito della pulizia dei dati all'interno di un database.

Nella migliore delle ipotesi, la ridondanza dei dati significa che il database è disseminato di informazioni che non sono essenziali ma non rappresenta una vera minaccia per la capacità di trovare i dati quando e secondo necessità. Nel peggiore dei casi, la presenza dei dati duplicati rallenta le funzioni essenziali del database e può complicare il processo di utilizzo del database per gestire determinate attività. Ad esempio, utilizzando un database dei clienti che è intasato con informazioni ridondanti per generare etichette postali WOL'ULD risulta nella creazione di un numero di livelli duplicati, rendendo necessario ordinare e smaltire i duplicati prima che le etichette possano essere utilizzate o prendi il tempo per ripulire il database prima di tentare di generare le etichette.

Fortunatamente, il monitoraggio e la correzione della ridondanza dei dati è qualcosa che molti sistemi di gestione dei dati possono realizzare con relativa facilità. Alcuni sistemi contrassegnano l'input di dati duplicati, facilitando la revisione della duplicazione percepita e decidono se eliminarli o permettergli di stare in piedi. Esistono anche programmi software che possono essere utilizzati per scansionare un database esistente per le duplicazioni e rimuovere automaticamente quelle voci ridondanti con relativa facilità.

Qual è la ridondanza dei dati?

ALTRE LINGUE

ARTICOLI CORRELATI

Come possiamo aiutare?