最も重要なデータマイニングの概念は何ですか?
最も重要なデータマイニングの概念は、収集された情報の分析に使用されます。最も顕著なのは、行動を観察するための取り組みです。データ間の不明な相互作用は、被験者と集計情報の間の重要な関係を確認するために、さまざまな方法で調査されています。データマイニングの課題の1つは、収集された実際の情報がドメイン全体を連想させない可能性があることです。この事実に対処するために、データ間の相関は、さまざまなデータマイニングの概念によって系統的に制御できます。
データマイニングの概念の標準は、知識発見とデータマイニング(SIGKDD)に関するMachineryの特別利益グループのコンピューティング協会によって施行されています。この組織は、「International Journal of Information Technology and Decision Making」と、Journal Sigkdd Explorationsを公開しています。>情報の前処理は、データマイニングの最も重要な側面の1つです。生データを採掘して解釈する必要があります。このアクションを実行するには、プロセスを決定する必要があり、ターゲットデータを組み立て、パターンが見つかります。このプロセスは、データベースで知識発見として知られており、1989年にGregory Piatetsky-Shapiroによって開発されました。
データマイニングの概念の4つの異なるクラスにより、プロセスが行われます。 Clustering は、データマイニングプロセスから作成されたアルゴリズムを使用して、アイテムを同様のグループに組み立てます。クラスタリングとは異なり、情報の分類分類は、データが事前定義されたグループに組み立てられて分析された場合です。 Association 変数間の関係を見つけようとし、どのデータグループが一般的に関連付けられているかを決定します。データマイニングの最終タイプは、方法に基づいて回帰です。fデータ収集内の関数の識別 情報の検証は、データマイニングアプリケーションが表すものを発見するための最終ステップです。すべてのアルゴリズムが有効なデータセットを提示しているわけではない場合、発生するパターンは、オーバーフィッティングと呼ばれる状況につながる可能性があります。この問題を克服するために、データはテストセットと比較されます。これは、測定値が、もっともらしい一連のデータセットを提供する一連のアルゴリズムと一致する概念です。取得した情報がテストセットに並んでいない場合、データ内の想定パターンは不正確でなければなりません。 最も重要なデータマイニングの概念のいくつかは、さまざまな業界で発生しています。ゲーム、ビジネス、マーケティング、科学、エンジニアリング、監視はすべて、データマイニング技術を利用しています。これらの手法を実施することにより、各フィールドは結果を見つけるためのベストプラクティスまたはより良い方法を決定できます。