変更データキャプチャとは
変更データキャプチャは、データシステムでバージョンレコードを検索、記録、保存するプロセスです。 ほとんどの場合、変更データキャプチャシステムは、特定のデータエントリを参照する特定のマーカーをデータに付与することで機能します。 データが変更されると、これらのマーカーも変更されます。 これは、変更データキャプチャシステムに警告し、古いデータバージョンを保存して、ユーザーとシステムが古いデータと新しいデータの両方にアクセスできるようにします。 これらのプロセスは、データウェアハウスやWebベースのデータシステムなどの大規模なデータストレージシステムで一般的です。
データのバージョン管理は、データストレージの非常に重要な側面と見なされます。 あるデータが別のデータによって上書きされると、元のデータは消えることができません。 その情報が進行中のプロセスまたは企業記録にとって重要である場合、これは大混乱を引き起こします。
さまざまなデータピースのバージョンを作成することが、変更データキャプチャの中心です。 単一の情報が5回変更される場合、システムは5つの値のそれぞれとそれらがいつ変更されたかを記憶する必要があります。 これは、長期の記録保持とエラーチェックの両方にとって重要です。 たとえば、従業員がデータベースの間違った部分に売上高を代入すると、膨大な量の情報が混乱する可能性があります。 バージョン管理により、会社は必要に応じてその番号を元に戻すことができます。
変更データキャプチャの設定方法は1つではありません。 さまざまなデータシステムは独自のバージョンを使用します。多くの場合、独自のスタイルのデータストレージに合わせて社内で開発されます。 そうであっても、一般的に使用されるいくつかの方法があります。 単一のシステムが、同じシステムで動作する変更データキャプチャのいくつかの異なる方法を持つことは珍しくありません。 多くの場合、各メソッドは特定の種類のキャプチャに特化しているか、冗長なフェイルセーフシステムとして動作します。
異なるバージョンのデータを作成する最も一般的な方法は、データ内の特別なマーカーです。 これらのマーカーは、変更が発生したタイミングを追跡するデータ内の特別な行または列にあります。 変更データキャプチャスクリプトは、これらの領域の変更を監視し、行われた変更を追跡します。 これらの特別なセルには、バージョン番号、タイムスタンプ、または独自のデータ文字列が含まれる場合があります。
全面的な変更データキャプチャシステムを見つける最も一般的な2つの場所は、データウェアハウスとオープンアクセスデータベースです。 データウェアハウジングの主なセールスポイントの1つは、データの継続的かつ包括的なバックアップです。 ユーザーが自分のサービスに加入している限り、これらのシステムは何も取り除きません。 ウィキペディアなどのオープンアクセスデータベースは、バージョン管理を使用して、改ざんを防ぎ、どのユーザーがどの変更を加えたかを記録します。 ウィキペディアのバージョン管理は、データウェアハウスで使用されているものほど包括的ではないかもしれませんが、多くの場合、より多くのユーザーによって検証されています。