さまざまなデータマイニング方法とは何ですか?
ソフトウェアオプションと理論的概念の両方で、さまざまなデータマイニング方法が使用されています。 これらにより、ユーザーはさまざまなツールを利用して個人や企業が収集したデータから情報を抽出できます。 大量のデータを使用して、単一の被験者またはさまざまな被験者のさまざまな要因を判断できます。 これらのデータマイニング手法は、不正保護、マーケティング、および監視の分野で最も一般的に利用されています。
何百年もの間、データマイニング手法は、被験者から情報を抽出するために使用されてきました。 しかし、最新の手法では、自動化された概念を使用して、コンピューター化されたリソースを介して実質的なデータを提供しています。 20世紀にコンピューターサイエンスが登場すると、収集されたデータの大きな帯に隠されたパターンを克服するために、データマイニング手法の概念が発展しました。 これの良い例は、広告会社がオンライン顧客のショッピングパターンを分析する場合です。 その後、この会社は、個人が購入に関心を持つ可能性のある特定の製品を販売できます。
業界で一般的に使用されるデータマイニング手法の1つは、データベースの知識発見(KDD)と呼ばれます。 1989年にグレゴリーピアテツキーシャピロによって開発されたKDDは、ユーザーが生データを処理し、必要なデータの情報を分析し、結果を解釈することを可能にします。 この方法により、ユーザーはアルゴリズムのパターンを見つけることができますが、一般的なデータは常に正確であるとは限らず、妥協的な方法でまとめることができます。 これは過剰適合として知られています 。
基本的なデータマイニング方法には、分類、クラスタリング、回帰、および関連付けという4つの特定の種類のタスクが含まれます。 分類は、存在する情報を取得し、定義されたグループにマージします。 クラスタリングにより、定義されたグループ化が削除され、データが同様のアイテムで分類されるようになります。 回帰は、情報の機能に焦点を当て、概念に関するデータをモデル化します。 最終的なデータマイニング方法であるassociationは、さまざまなデータフィード間の関係を見つけようとします。
さまざまなデータマイニング方法を使用する場合、特定の標準を使用して、プロセスで使用できるパラメーターを決定します。 Association for Computing Machineryの知識発見とデータマイニングに関する特別関心グループ(SIGKDD)は、適切なプロセスを決定する年次会議を開催しています。 個人および企業に関する最良の情報を見つけるために、倫理的要因と実際のアプリケーションを比較検討します。 この情報は、 SIGKDD Explorationsと呼ばれる業界誌に掲載されています。