データマイニングとは何ですか?
データマイニングは、大量のデータセットで動作する比較的大量のコンピューティングパワーを使用して、データポイント間の規則性と接続を決定します。 統計、機械学習、パターン認識から手法を使用するアルゴリズムは、大きなデータベースを自動的に検索するために使用されます。 データマイニングは、データベース(KDD)の知識発見としても知られています。
人工知能のように、データマイニングはさまざまなアクティビティに適用できる傘の用語です。 企業の世界では、データマイニングが最も頻繁に使用され、傾向の方向を決定し、将来を予測します。 使用できる情報を人々に提供するモデルと意思決定支援システムを構築するために採用されています。 データマイニングは、テロとの戦いにおいて最前線の役割を担っています。 9/11攻撃のリーダーを決定するために使用されたと思われます。ring 、 Holdout Method 、 k-fold Cross Validation 、 leave-one-out method など。 回帰手法は、無関係なパターンを差し引くために使用され、有用な情報のみを残します。 bayesian という用語は、条件付きイベントに基づいて以前の確率と確率を組み合わせることにより、将来のイベントの可能性を予測する推論技術のクラスを指し、フィールドで頻繁に見られます。 スパムフィルタリングは間違いなくデータマイニングの形式であり、フィッシングの試みとバイアグラのピッチの混oticとした海から表面に関連するメッセージを自動的にもたらします。
決定ツリーは、データの山をフィルタリングするために使用されます。 決定ツリーでは、すべてのデータが入り口ノードを通過し、その特性に応じてデータをストリームに分離するフィルターに面しています。 たとえば、消費者の行動に関するデータは、Dに基づいてフィルタリングされる可能性がありますエモグラフィック要因。 データマイニングは、主に派手なグラフと視覚化技術に関するものではありませんが、それが見つけたものを示すためにそれらを採用しています。 口頭よりも視覚的に統計情報を吸収できることが知られています。この形式のためのこの形式は、適切なコンテキストで使用すると非常に説得力があり強力です。
私たちの文明はますますデータ飽和状態になり、センサーが地元の環境に一致して分布しているため、最初のパスで見逃される可能性のあるものを誤って発見します。 データマイニングは、これらの間違いを修正し、過去のデータに基づいて新しい洞察を発見することで、データストレージバックにもっと多くのことを与えてくれます。