ビッグデータとは?
ビッグデータとは、通常のデータベースが膨大な量の情報を格納して操作できないほど大きくなったデータの測定値です。 データには、小、中、大の3つのサイズがあります。 これらの測定値はどれも厳密ではありません。 代わりに、それぞれは、使いやすさと、情報を処理できるマシンの種類により依存しています。 ビッグデータには、通常のデータベースに使用されるマシンよりもはるかに大きく複雑な特別なマシンが必要です。 これらのタイプのデータは通常、政府機関や科学機関で見られますが、一部の非常に大きなWebサイトにもこの大量の情報が含まれています。
データには3つの標準サイズがありますが、厳密なサイズではありません。 小さなデータは、ラップトップなどの単一のコンピューターまたはマシンに適合できます。 中規模のデータはディスクアレイに収まり、データベースで管理するのが最適です。 データベースは、どんなに大きくても、ビッグデータを扱うことができず、代わりに特別なシステムが多く使用されます。 ビッグデータの厳密なガイドラインはありませんが、通常はテラバイト(TB)レベルから始まり、ペタバイト(PB)レベルまで上がります。
この量のデータに特化していないデータベース上のビッグデータを操作しようとすると、いくつかの重大な問題が発生します。 データベースは大量の情報を処理できないため、一部のデータを消去する必要があります。 これは、50 GBのハードドライブ領域しかないコンピューターに100ギガバイト(GB)を収めようとするようなものです。 できません。 残されたデータは、制御と管理の両方にとって扱いにくいものになります。これは、すべての機能が完了するまでに時間がかかり、データベースを新規送信のために閉じる必要があるためです。
マシンを購入し、データベースに新しいデータを追加し続けることは可能ですが、これは扱いにくい問題を引き起こします。 これは、データベースソフトウェアが中程度のデータでのみ動作するように作られているためです。 データセットを大きくすると、エラーや管理上の問題が発生します。これは、ソフトウェアが問題に遭遇しない限り、大きなデータを移動したり操作したりできないためです。
ビッグデータは、ほとんどの組織やウェブサイトでは遭遇しません。 防衛および軍事機関は、この量の情報を使用してモデルを作成し、テスト結果を保存します。多くの大規模な科学機関は、同様の理由でこれらの特殊なマシンを必要とします。 一部の非常に大きなWebサイトには大きなデータマシンが必要ですが、Webサイトはこの市場の代理店ほど一般的ではありません。 これらの組織はすべてのデータを保持する必要があります。これは、将来のデータをよりよく分析し、予測を行うのに役立つためです。