汚れたデータとは何ですか?

汚れたデータは、時代遅れ、不完全、または正確ではないあらゆる種類の電子データを記述するために使用される用語です。 このタイプのデータは、データ入力のエラー、定期的にデータを更新できないこと、または同じデータのエントリさえ複数回更新できないために作成される場合があります。 時には、誤ったデータは、電子文書のテキストの句読点のエラーにすぎません。 他の例では、汚れたデータは、投資家や他の人々に特定の画像を提示するために会計記録を変更しようとする試みなど、意図的に誤解を招く情報である可能性があります。

ほとんどの場合、あらゆるタイプのデータベースに汚れたデータの蓄積は意図的ではありません。 データベースに新しい情報を入力している個人は、単語を間違えたり、テキストの意図を理解するために重要な句読点を除外したり、特定の書式設定戦略に従わない場合があります。 このタイプの状況では、間違った情報を修正することは比較的単純なプロセスですそれには、誤ったテキストを変更して変更を保存する以外に何も必要です。 企業は、入力された後にデータを校正し、必要な更新を行うことにより、このプロセスを管理することがあります。

情報が変更されたときに既存のレコードを更新しなかったため、汚れたデータも発生する可能性があります。 たとえば、営業担当者が特定の顧客で人事の変更が発生したときに販売員が顧客ファイルの更新に失敗した場合、それらのファイルはもはや正確ではなく、汚れていると見なされます。 スペルや句読点の修正と同様に、時間をかけて時代遅れの情報を削除し、現在のデータに置き換えるのに、データベースの全体的な使いやすさを高めることができます。

汚れたデータの作成が意図的な状況があります。 企業は、GEの量を強調するなど、財務に関する特定の認識を作成するために、データベースから特定の情報を省略することを選択できます。特定の期間の収益を新たにしましたが、同じ期間の収集された収益額に関連するデータを入力しないことを選択します。 このタイプの汚れたデータでは、提示される情報は、それが行く限り正確ですが、不完全と見なされます。

いくつかのタイプの汚れたデータを使用すると、決定は修正を行うために時間と労力を費やさないことです。 これは、誤ったデータがビジネスが適切に機能する能力に影響を与えないか、大きな苦痛を引き起こす可能性がない場合に一般的です。 これは、何らかのタイプのデータベースを維持するほぼすべてのエンティティが、おそらく最新かつ正確な他の情報が散在する少なくとも少し汚れたデータを持っていることを意味します。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?