Quali sono i diversi tipi di progettazione del data warehouse?

I data warehouse archiviano enormi quantità di dati per l'utilizzo in molti campi diversi. Esistono due tipi principali di progettazione del data warehouse: top-down e bottom-up. I due design hanno i loro vantaggi e svantaggi. Il bottom-up è più facile ed economico da implementare, ma è meno completo e le correlazioni dei dati sono più sporadiche. In una progettazione top-down, le connessioni tra i dati sono ovvie e ben stabilite, ma i dati potrebbero non essere aggiornati e il sistema è costoso da implementare.

I data mart sono la figura centrale nella progettazione del data warehouse. Un data mart è una raccolta di dati basata su un singolo concetto. Ogni data mart è un sottoinsieme unico e completo di dati. Ognuna di queste raccolte è completamente correlata internamente e spesso ha connessioni a data mart esterni.

Il modo in cui vengono gestiti i data mart è la principale differenza tra i due stili di progettazione del data warehouse. Nella progettazione top-down, i data mart si verificano in modo naturale quando i dati vengono inseriti nel sistema. Nella progettazione bottom-up, i data mart vengono realizzati direttamente e collegati insieme per formare il magazzino. Anche se questa può sembrare una differenza minore, crea un design molto diverso.

Il metodo top-down era il design originale del data warehouse. Utilizzando questo metodo, tutte le informazioni in possesso dell'organizzazione vengono inserite nel sistema. Ogni vasto argomento avrà una propria area generale all'interno delle banche dati. Man mano che i dati vengono utilizzati, appariranno connessioni tra punti di dati correlativi e appariranno i data mart. Inoltre, tutti i dati nel sistema rimangono lì per sempre — anche se i dati vengono sostituiti o banalizzati da informazioni successive, rimarranno nel sistema come una registrazione degli eventi passati.

Il metodo dal basso verso l'alto della progettazione del data warehouse funziona dalla direzione opposta. Una società inserisce informazioni come data mart autonomo. Col passare del tempo, altri set di dati vengono aggiunti al sistema, come proprio data mart o come parte di uno già esistente. Quando due data mart vengono considerati sufficientemente connessi, si uniscono in un'unica unità.

I due progetti di data warehouse hanno ciascuno i propri punti di forza e di debolezza. Il metodo top-down è un grande progetto per set di dati ancora più piccoli. Poiché i grandi progetti sono anche più costosi, è il più costoso in termini di denaro e manodopera. Se il data warehouse è terminato e gestito, si tratta di una vasta raccolta, contenente tutto ciò che l'azienda conosce.

Il processo dal basso verso l'alto è molto più rapido ed economico, ma poiché i dati vengono immessi in base alle esigenze, il database non sarà mai effettivamente completo. Inoltre, le correlazioni tra i data mart sono tanto forti quanto il loro utilizzo le rende. Se esiste una forte correlazione, ma nessun utente la vede, non viene connessa.

ALTRE LINGUE

Questo articolo è stato utile? Grazie per il feedback Grazie per il feedback

Come possiamo aiutare? Come possiamo aiutare?