ダーティデータとは
ダーティデータとは、古くなった、不完全な、またはそうでなければ正確ではないあらゆる種類の電子データを表すために使用される用語です。 このタイプのデータは、データ入力のエラー、定期的なデータ更新の失敗、または同じデータの複数回の入力が原因で作成される場合があります。 時々、誤ったデータは、電子文書のテキストの句読点のエラーにすぎません。 他の例では、ダーティデータは、会計記録を変更して特定の画像を投資家などに提示しようとするなど、意図的に誤解を招く情報である場合があります。
ほとんどの場合、あらゆるタイプのデータベースでのダーティデータの蓄積は意図的ではありません。 データベースに新しい情報を入力する個人は、単語のつづりを間違えたり、テキストの意図を理解するために重要な句読点を省略したり、特定のフォーマット戦略に従わなかったりする場合があります。 このタイプの状況では、誤った情報を修正するのは比較的単純なプロセスであり、間違ったテキストを変更して変更を保存するだけです。 企業は、入力されたデータを校正し、必要な更新を行うことにより、このプロセスを管理することがあります。
ダーティデータは、情報が変更されたときに既存のレコードを更新できないために発生する場合もあります。 たとえば、特定の顧客で人事異動が発生したときに営業担当者が顧客ファイルを更新できなかった場合、それらのファイルは正確ではなくなり、ダーティと見なされます。 スペルや句読点のエラーの修正と同様に、時間をかけて古い情報を削除し、それを現在のデータで置き換えると、データベースの全体的な使いやすさが向上します。
ダーティデータの作成が意図的な場合があります。 企業は、特定の期間に発生した収益の量を強調するなど、財務に関する特定の認識を作成するためにデータベースから特定の情報を省略することを選択する場合がありますが、期間。 このタイプのダーティデータでは、表示される情報は正確ですが、不完全であると見なされます。
ダーティデータの種類によっては、修正に時間と労力を費やさないことが決定される場合があります。 これは、誤ったデータがビジネスの適切な機能に影響を与えない場合、または大きな苦痛を引き起こす可能性がない場合によく起こります。 これは、何らかのタイプのデータベースを維持するほぼすべてのエンティティが、現在の正確な他の情報が散在する少なくとも少しダーティなデータをおそらく持っていることを意味します。