データマイニング分類とは何ですか?
データマイニング分類は、データマイニングのプロセスの1つのステップです。特定の重要な特性に基づいてアイテムをグループ化するために使用されます。データマイニングの分類に使用されるいくつかの手法があります。これには、最近隣の分類、決定ツリー学習、ベクターマシンのサポートが含まれます。
データマイニングは、研究者がデータからパターンを抽出するために使用する方法です。通常、代表的なサンプルがデータのプールから選択され、操作および分析されてパターンを見つけます。データマイニングの分類に加えて、研究者はクラスタリング、回帰、およびルール学習を使用してデータを分析することもできます。
データマイニング分類で使用できるいくつかのアルゴリズムがあります。最近傍分類は、データマイニング分類アルゴリズムの中で最も単純なものの1つです。トレーニングセットに依存しています。トレーニングセットとは、コンピューターに特定の変数に注意を払うようにトレーニングするために使用される一連のデータです。最も近い隣の分類では、コンピューターは単にCLAですSSSは、入力に最も近いデータを含むグループの一部としてすべてのデータを違います。
決定ツリー学習は、分岐モデルを使用してデータを分類します。コンピューターは基本的に、データに関する一連の質問をします。最初の質問に対する答えが真実である場合、それは質問2aを尋ねます。答えが偽の場合、質問2bを尋ねます。引き出されると、この方法は分岐パスの木を形成します。
ナイーブベイズ分類は確率に依存しています。各データについて一連の質問をし、回答を使用して、データが特定の分類に属する確率を決定します。これは、最初の質問に対する答えが次にどの質問が尋ねられるかに影響しないため、決定ツリー学習とは異なります。
データマイニング分類のより複雑な方法には、ニューラルネットワークとサポートベクターマシンが含まれます。これらの方法はコンピューターベースのmです手作業で行うのが難しいオデル。ニューラルネットワークは、人間の脳を模倣するため、人工知能プログラミングでよく使用されます。パターンを見つけて情報を分類する一連のノードを介して情報をフィルタリングします。
サポートベクトルマシンは、トレーニングサンプルを使用して、カテゴリ間の広いスペースを持つ散布図として視覚化される情報を分類するモデルを構築します。新しい情報がマシンに供給されると、グラフにプロットされます。その後、データは、どのカテゴリがグラフに最も近いかに基づいて分類されます。この方法は、から2つのオプションがある場合にのみ機能します。