Che cos'è il test del data warehouse?
Il test del data warehouse è un processo utilizzato per ispezionare e qualificare l'integrità dei dati mantenuta in un tipo di struttura di archiviazione. L'idea alla base del test è assicurarsi che i dati non abbiano subito alcun tipo di corruzione e rimangano completi e recuperabili quando e quando necessario. Il test regolare dei dati memorizzati consente di identificare eventuali problemi che potrebbero essere in via di sviluppo e di correggerli prima che i dati memorizzati vengano completamente danneggiati e possano essere parzialmente ricostruiti utilizzando un qualche tipo di processo di recupero dei dati.
In molti modi, il test del data warehouse è molto simile a qualsiasi tipo di test eseguito per garantire l'integrità delle informazioni memorizzate su un disco rigido del computer o su un dispositivo di archiviazione remoto. I dati contenuti nel magazzino vengono sistematicamente controllati utilizzando un programma software che legge ogni file o altra fonte di dati per assicurarsi che rimanga completamente intatto e accessibile. Alcuni tipi di software di test del data warehouse hanno la capacità di correggere una gamma limitata di errori come parte del processo di test generale. Altri semplicemente compilano un elenco delle eccezioni, consentendo all'utente di valutare ogni eccezione singolarmente prima di intraprendere qualsiasi azione.
I test del data warehouse in genere utilizzano un modello attivato dal sistema. Ciò significa semplicemente che il software utilizza una formula di base nota come ETL o estrazione-trasformazione-caricamento. L'idea è di confrontare la condizione corrente dei dati con la condizione delle informazioni quando sono state archiviate per la prima volta. Se vengono identificati errori, i dati vengono contrassegnati per un'ulteriore revisione. Nella maggior parte dei casi, gli errori o le eccezioni sono minori e possono essere riparati con relativamente poco sforzo, utilizzando protocolli integrati nel software di test o mediante revisione da parte di un analista che può approvare la riparazione o respingere l'eccezione in quanto realmente un qualche tipo di corruzione .
Il processo di base del test del data warehouse è molto simile al test di qualsiasi tipo di transazione elettronica di informazioni. Le informazioni vengono esaminate in blocchi o celle che vengono quindi cancellate o annotate per eventuali eccezioni che il software ha identificato prima di passare al blocco successivo. Una volta completato il processo, viene compilato un riepilogo del test, incluse informazioni sui tipi di eccezioni rilevate e se tali eccezioni sono state corrette durante il test o sono in attesa di revisione manuale. Come per qualsiasi tipo di test di sistema, è consigliabile condurre test di data warehouse su base regolare al fine di garantire che le informazioni rimangano complete e prive di qualsiasi tipo di corruzione.