Quali sono i diversi tipi di design del data warehouse?
Data Warehouses archivia grandi quantità di dati da utilizzare in molti campi diversi. Esistono due tipi principali di design del data warehouse: top-down e bottom-up. I due progetti hanno i loro vantaggi e svantaggi. Il bottom-up è più facile e più economico da implementare, ma è meno completo e le correlazioni dei dati sono più sporadiche. In una progettazione dall'alto verso il basso, le connessioni tra i dati sono evidenti e ben consolidate, ma i dati possono essere obsole e il sistema è costoso da implementare.
Data Marts sono la figura centrale nella progettazione del data warehouse. Un data mart è una raccolta di dati basati su un singolo concetto. Ogni data mart è un sottoinsieme unico e completo di dati. Ognuna di queste collezioni è completamente correlata internamente e spesso ha connessioni a dati esterni.
Il modo in cui i dati mart vengono gestiti è la differenza principale tra i due stili della progettazione del data warehouse. Nel design dall'alto verso il basso, i data mart si verificano naturalmente quando i dati vengono inseriti nel sistema. Nel design dal basso verso l'alto, DI mart ATA vengono realizzati direttamente e collegati insieme per formare il magazzino. Anche se questa può sembrare una differenza minore, è un design molto diverso.
Il metodo top-down era il design originale di data warehouse. Utilizzando questo metodo, tutte le informazioni detiene l'organizzazione vengono inserite nel sistema. Ogni argomento ampio avrà una propria area generale all'interno dei database. Man mano che vengono utilizzati i dati, appariranno connessioni tra punti dati correlativi e appariranno i dati di dati. Inoltre, tutti i dati nel sistema rimangono lì per sempre: anche se i dati vengono sostituiti o banalizzati da informazioni successive, rimarrà nel sistema come record di eventi passati.
Il metodo bottom-up di Data Warehouse Design funziona dalla direzione opposta. Una società inserisce informazioni come data mart autonomo. Col passare del tempo, altri set di dati vengono aggiunti al sistema, sia come i loro dati mart or come parte di uno che già esiste. Quando due data mart sono considerati abbastanza connessi, si uniscono in una singola unità.
I due progetti di data warehouse hanno ciascuno i propri punti forti e deboli. Il metodo top-down è un grande progetto per set di dati ancora più piccoli. Poiché i grandi progetti sono anche più costosi, è il più costoso in termini di denaro e manodopera. Se il data warehouse è finito e mantenuto, è una vasta collezione, contenente tutto ciò che la società conosce.
Il processo dal basso verso l'alto è molto più veloce ed economico, ma poiché i dati vengono inseriti secondo necessità, il database non sarà mai effettivamente completo. Inoltre, le correlazioni tra i data mart sono forti solo quanto il loro utilizzo li rende. Se esiste una forte correlazione, ma nessun utenti la vede, non si collega.