Come si mantengono la qualità del data warehouse?
Ci sono quattro fattori principali da considerare quando si sta cercando di mantenere la qualità del data warehouse: integrità dei dati, fonte di input dei dati e metodologia utilizzata, frequenza di importazione dei dati e pubblico. Un data warehouse è un repository elettronico di grandi quantità di dati e viene utilizzato sempre più dalle aziende e da altre organizzazioni più grandi per archiviare i dati in uno strumento che facilita i requisiti di reporting e di output dei dati. L'utilità di un data warehouse è guidata principalmente dalla qualità dei dati e dalla reattività ai requisiti dell'utente.
L'integrità dei dati è un concetto comune alla qualità del data warehouse in quanto si riferisce alle regole che regolano le relazioni tra dati, date, definizioni e regole aziendali che modellano la rilevanza dei dati per l'organizzazione. Mantenere i dati coerenti e riconciliabili è il fondamento dell'integrità dei dati. I passaggi utilizzati per mantenere la qualità del data warehouse devono includere un piano di architettura dei dati coesi, un'ispezione regolare dei dati e thE l'uso di regole e processi per mantenere i dati coerenti quando possibile.
L'origine di input dati per un data warehouse è in genere uno strumento o programma di importazione. Il modo più semplice per mantenere la qualità del data warehouse è implementare regole e punti di controllo nel programma di importazione dei dati stessa. I dati che non seguono il modello appropriato non verranno aggiunti al data warehouse ma richiederanno l'intervento dell'utente per correggere, riconciliare o modificare il programma. In molte organizzazioni, questi tipi di modifiche possono essere implementati solo dall'architetto del data warehouse, che aumenta notevolmente la qualità del data warehouse.
L'accuratezza e la rilevanza dei dati sono essenziali per mantenere la qualità del data warehouse. I tempi dell'importazione e della frequenza hanno un grande impatto sull'utilità complessiva dello strumento e sulla qualità. Ad esempio, se le informazioni sull'ordine di acquisto vengono inserite nel magazzino BULe fatture T vengono aggiornate solo in modo intermittente, è compromessa la possibilità di riferire accuratamente sull'attività relativa all'acquisto.
La qualità del data warehouse è più semplice da mantenere e supportare se gli utenti sono ben informati e hanno una solida comprensione dei processi aziendali. La formazione degli utenti non solo a comprendere come costruire query, ma sulla struttura di data warehouse sottostante consente loro di identificare le incoerenze molto più velocemente e di evidenziare potenziali problemi all'inizio del processo. Eventuali modifiche alle tabelle di dati, alla struttura o ai collegamenti e all'aggiunta di nuovi campi di dati devono essere riviste con l'intero team di utenti e i membri del personale di supporto al fine di garantire una costante comprensione dei rischi e delle sfide che potrebbero verificarsi.