Che cos'è Change Data Capture?
L'acquisizione dei dati di modifica è il processo di individuazione, registrazione e salvataggio dei record di versione nei sistemi di dati. Nella maggior parte dei casi, i sistemi di acquisizione dei dati di modifica funzionano fornendo dati a determinati marcatori che fanno riferimento a voci di dati specifiche. Quando i dati vengono modificati, anche questi marker cambiano. Ciò avvisa il sistema di acquisizione dei dati di modifica e salva la versione precedente dei dati, offrendo agli utenti e ai sistemi l'accesso a dati vecchi e nuovi. Questi processi sono comuni nei grandi sistemi di archiviazione dei dati come data warehouse e sistemi di dati basati sul web.
I dati sulle versioni sono considerati un aspetto molto importante della memorizzazione dei dati. Quando un pezzo di dati viene sovrascritto da un altro, il pezzo di dati originale non può semplicemente scomparire. Ciò causerebbe il caos se quella informazione fosse importante per un processo in corso o record aziendale.
La creazione di versioni di diversi pezzi di dati è il centro dell'acquisizione dei dati di modifica. Se una singola informazione cambia cinque volte, il sistema deve ricordare ciascuno dei cinque valori e quando sono cambiati. Ciò è importante sia per la conservazione della documentazione a lungo termine che per il controllo degli errori. Ad esempio, se un lavoratore imputava una cifra di vendita nella parte errata di un database, potrebbe interrompere un'enorme quantità di informazioni. Il controllo delle versioni consente all'azienda di ripristinare tale numero, se necessario.
Non esiste un solo metodo per modificare l'acquisizione dei dati. Diversi sistemi di dati utilizzano le proprie versioni, spesso sviluppate internamente per accompagnare il proprio stile specifico di archiviazione dei dati. Anche così, ci sono una manciata di metodi che sono comunemente usati. Non è insolito per un singolo sistema avere diversi metodi di acquisizione dei dati che operano sullo stesso sistema. Spesso, ogni metodo è specializzato in un determinato tipo di acquisizione o funziona come un sistema ridondante di sicurezza.
I metodi più comuni per la creazione di diverse versioni dei dati sono marcatori speciali nei dati. Questi marcatori si trovano in una riga o colonna speciale nei dati che tiene traccia di quando si verificano modifiche. Gli script di acquisizione dei dati di modifica osservano queste aree per le modifiche e tengono traccia delle modifiche apportate. Queste celle speciali potrebbero contenere numeri di versione, timestamp o stringhe di dati proprietari.
I due luoghi più comuni per trovare sistemi di acquisizione dei dati di modifica su larga scala si trovano nei data warehouse e nei database ad accesso aperto. Uno dei principali punti di forza per il data warehousing è il backup costante e completo dei dati. Finché un utente si abbona ai propri servizi, questi sistemi non si liberano mai di nulla. I database ad accesso aperto, come Wikipedia, utilizzano il controllo delle versioni per evitare manomissioni e tenere traccia degli utenti che hanno apportato le modifiche. Mentre il controllo delle versioni di Wikipedia potrebbe non essere completo come quelli utilizzati nei data warehouse, viene spesso esaminato da più utenti.