データの冗長性とは
データの冗長性は、データベースシステム内で発生する状況であり、データベースの機能に不要な複製データの意図しない作成を伴います。 多くの場合、冗長性は状況によっては望ましい特性ですが、データベースの機能に関してはそうではありません。 重複したデータが存在すると、システムの機能に悪影響を与えることが多く、システムクエリへの応答として有用ではない情報が返されます。 データ管理の重要な機能の1つは、重複データの識別とそれらの重複の除去です。
データ冗長性の可能性は、ほぼすべての種類のデータベースプログラムに見られます。 スプレッドシートなどのフラットと見なされ、データの手動入力に依存するプログラムは、情報の複製の影響を特に受けやすく、必要な情報を取得する際に問題が発生する可能性があります。 営業連絡先データベースなどのリレーショナルスタイルデータベースには、同じ会社に関連付けられた同じ連絡先に2つの異なる連絡先ファイルを作成するなど、意図しない重複の可能性を最小限に抑えるプロセスが含まれることがよくあります。 システムチェックを使用してデータの冗長性の発生を減らしても、問題が発生する可能性があるため、データベース内のデータクリーンアップタスクに定期的に取り組む必要があります。
せいぜい、データの冗長性とは、データベースに必要不可欠ではないが、必要なときに必要なときにデータを検索する機能に対して実際の脅威をもたらさない情報が散らばることを意味します。 最悪の場合、複製されたデータが存在すると、データベースの重要な機能が遅くなり、データベースを使用して特定のタスクを管理するプロセスが複雑になります。 たとえば、重複する情報で詰まった顧客データベースを使用して宛名ラベルを生成すると、多数の重複したレベルが作成され、ラベルを使用する前に重複をソートして廃棄するか、ラベルを生成する前にデータベースをクリーンアップする時間。
幸いなことに、データの冗長性の監視と修正は、多くのデータ管理システムが比較的簡単に達成できるものです。 一部のシステムは、重複したデータの入力にフラグを立て、認識された重複を簡単に確認し、それを削除するか、そのままにしておくかを決定します。 既存のデータベースの重複をスキャンし、それらの冗長エントリを比較的簡単に自動的に削除するために使用できるソフトウェアプログラムもあります。