データマイニング分類とは
データマイニング分類は、データマイニングのプロセスにおける1つのステップです。 特定の重要な特性に基づいてアイテムをグループ化するために使用されます。 データマイニングの分類には、最近傍分類、決定木学習、サポートベクターマシンなど、いくつかの手法が使用されます。
データマイニングは、研究者がデータからパターンを抽出するために使用する方法です。 通常、代表的なサンプルはデータのプールから選択され、パターンを見つけるために操作および分析されます。 データマイニングの分類に加えて、研究者はクラスタリング、回帰、およびルール学習を使用してデータを分析することもできます。
データマイニング分類で使用できるアルゴリズムはいくつかあります。 最近傍分類は、最も単純なデータマイニング分類アルゴリズムの1つです。 トレーニングセットに依存しています。 トレーニングセットは、特定の変数に注意を払うようにコンピューターをトレーニングするために使用されるデータのセットです。 最近傍分類では、コンピューターは、入力に値が最も近いデータを含むグループの一部としてすべてのデータを単純に分類します。
決定木学習では、分岐モデルを使用してデータを分類します。 コンピューターは基本的にデータについて一連の質問をします。 最初の質問への答えが正しい場合、質問2aを尋ねます。 答えが偽の場合、質問2bを要求します。 描画すると、このメソッドは分岐パスのツリーを形成します。
単純ベイズ分類は確率に依存しています。 各データについて一連の質問を行い、その回答を使用して、データが特定の分類に属する確率を決定します。 これは、最初の質問への回答が次に質問される質問に影響しないため、決定木学習とは異なります。
データマイニング分類のより複雑な方法には、ニューラルネットワークとサポートベクターマシンが含まれます。 これらの方法は、手作業で行うのが難しいコンピューターベースのモデルです。 ニューラルネットワークは、人間の脳を模倣するため、人工知能プログラミングでよく使用されます。 パターンを検出し、情報を分類する一連のノードを通じて情報をフィルタリングします。
サポートベクターマシンは、トレーニングサンプルを使用して、情報を分類するモデルを構築します。通常、情報は分類され、カテゴリ間の間隔が広い散布図として視覚化されます。 新しい情報がマシンに入力されると、グラフにプロットされます。 データは、情報がグラフに最も近いカテゴリに基づいて分類されます。 この方法は、2つのオプションから選択する場合にのみ機能します。