データマイニングツールとは
データマイニングツールは、ユーザーがデータから情報を抽出できるソフトウェアコンポーネントと理論です。 このツールは、個人や企業が大量のデータを収集し、それを使用して特定のユーザーまたはユーザーのグループについて判断する機能を提供します。 データマイニングツールの最も一般的な使用法のいくつかは、マーケティング、不正防止、および監視の分野です。
データの手動抽出は何百年もの間存在していました。 ただし、データマイニングの自動化は、コンピューター時代のd明期から最も普及しています。 20世紀には、データマイニングツールの開発という概念をサポートするために、さまざまなコンピューターサイエンスが登場しました。 ツールの利用の全体的な目標は、隠れたパターンを明らかにすることです。 たとえば、マーケティング会社が、ニューヨーク市からロサンゼルスへの毎月の旅行を見つけた場合、その会社が目的地の詳細を個人に広告することは有益になります。
データマイニング業界では、データマイニングツールの使用に関するパラメータを定義するための標準が確立されています。 毎年、コンピューティング機械協会の知識発見とデータマイニングに関する特別関心グループ(SIGKDD)が、使用されるプロセスを決定するための会議を開催しています。 同じグループは、個人や企業からのデータの分析の倫理的意味を評価する責任も負っています。 SIGKDD Explorationsというタイトルのグループが年2回発行するジャーナルを発行しています。
データマイニングで使用される最も一般的なツールは、データベースの知識発見(KDD)と呼ばれるプロセスです。 KDDは、1989年にGregory Piatetsky-Shapiroによって開発されました。 このデータマイニングツールを使用すると、ユーザーは生データを処理し、データをマイニングして情報を取得し、さまざまな結果を情報管理の形で解釈できます。
データマイニングツールの最も重要な形式の1つは、21世紀のテロとの戦いに使用されます。 米国では、National Research Councilはパターンマイニングと主題ベースのデータマイニングの概念を使用して、世界中の膨大な情報プールでのテロ活動を特定しています。 パターンマイニングは、大量のデータ内でパターンを見つけるプロセスによって定義されます。 被験者ベースのデータマイニングは、個人間の関係を特定しようとします。 両方の手法は、顧客ベースの考え方と顧客間のインタラクティブな関係を定義することにより、一般的なビジネス慣行でも利用できます。