データ統合とは

データ統合とは、複数のデータソースを単一のデータソースにマージすることです。 さまざまなデータソースは互いに互換性がない可能性が高いため、この方法は多くの場合非常に時間がかかり、複雑です。 スプレッドシート上の異なる列名のような単純なもので、日付の再フォーマットが必要です。 このプロセスは、2つのグループが接続なしで開始されたが、独立して作業した後に一緒に配置される状況で最も一般的です。 無料のデータソースとオンラインデータベースの普及により、データ統合はより重要なトピックになりました。

データ統合のデータ部分は、コンピューターシステムに格納されている限り、ほとんど何でもかまいません。 データの実際の内容は、データの保存方法ほど重要ではありません。 ほとんどの場合、データは組織化された情報システムであるデータベースに保存されます。 これらのシステムには、ユーザーが情報をすばやく見つけることができる一意のエントリとフィールドが含まれています。

データ統合プロセスの最大の障害はデータそのものです。 多くの場合、データが最初にセットアップされたときに、データセットを別のデータセットとマージする意図はありませんでした。 これは、2つのデータセットが同じものを参照している場合でも、完全に互換性がないことを意味します。

ほとんど何でもデータベースに互換性がなくなります。 フィールドの順序や列の幅など、表示の違いと同じくらい簡単なものでも、簡単な合併を防ぐには十分です。 1つのデータベースに多少の情報が含まれているなど、データが大きく異なる場合、マージははるかに困難です。

データ統合を必要とする2つの状況は、ビジネス分野と研究分野です。 ビジネスの世界では、部門や企業を統合するには、以前は別個の情報を単一の構造に結合する必要があります。 この形式の統合は、元のグループが同様のソフトウェアを使用し、同様の情報目標を持たない限り、通常非常に困難です。

調査目的でデータ統合を実行すると、一般的にはるかにスムーズになります。 ある研究者が他の研究者に自分の情報へのアクセスを許可すると、2つの当事者は通常同じプロセスを検討します。 つまり、彼らは同様の方法を使用してデータをカタログ化し、保存します。

過去において、データ統合はデータ研究の比較的小さな分野でしたが、これは21世紀初頭から変化しています。 無料のオンラインデータベースの人気と正確性が高まるにつれて、企業は情報を共有可能な形式で入手しようと急いでいます。 これにより、情報を公開形式で公開することと、有名な公開インターフェイスのプライベートバージョンをシステムに統合することができます。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?