シーケンスマイニングとは
シーケンスマイニングは、データベースと管理者がデータのシーケンスまたは傾向を探す構造化データマイニングの一種です。 このデータマイニングは2つのフィールドに分割されます。 通常、アイテムセットシーケンスマイニングはマーケティングで使用され、文字列シーケンスマイニングは生物学研究で使用されます。 シーケンスマイニングは通常のトレンドマイニングとは異なります。データがより具体的であるため、データベース設計者が効果的なデータベースを構築することが難しくなり、シーケンスが一般的なシーケンスと異なる場合に問題が発生する場合があるためです。
ある時点で、すべてのデータベースがデータのマイニングに使用されます。 このマイニングは、企業や研究者が必要なものを見つけるのに役立ちます。 通常、彼らは何らかのトレンドを探していますが、そのトレンドが何であり、情報がどの程度具体的であるかは、データベースの設計に依存します。 シーケンスマイニングでは、データベースは非常に特定のシーケンスを検出するために構築され、変化はほとんどありません。 これは、データベースが構造化データを介して類似性を調べる、構造化データマイニングのユニークな形式です。
シーケンスマイニングは、2つのカテゴリに分類できます。 アイテムセットマイニングは、販売数、製品タイプ、店舗での製品の配置、および製品の使用の特定の傾向を見つけるために、マーケティングおよびビジネスで使用されます。 これらの数値は、マーケティングプロジェクトの戦略を立て、販売を強化するために、マーケティングアルゴリズムに適用されます。 製品に関する情報とその一般的な方法はデータベースから取得されますが、アイテムセットシーケンスマイニングの定義的側面は、シーケンスがマルチシンボルデータベースセルから取得されることです。
文字列マイニングは、クラスタとしてではなく各シンボルを個別に見るため、アイテムセットマイニングの反対です。 文字列マイニングでは、タンパク質ソースまたは遺伝子サンプルから配列を検索するようにデータベースを設定できます。 これは、多くの遺伝子サンプルを比較して、同じかどうかを確認したり、大きな配列を分解して、含まれている配列を見つけたりするのに役立ちます。 ほとんどの場合、生物学および医学研究チームがこれを使用します。
シーケンスマイニング用のデータベースの作成は、傾向マイニングやその他の構造化データマイニングとは異なり、シーケンスが互いに明確に一致する必要があるため、困難な場合があります。 これは、シーケンスのマイニングの問題にもつながります。 シーケンスが異なる場合、認識されず、アイテムセットのマイニングがより困難になる可能性があります。 通常、ストリングマイニングは、組織サンプルのわずかな違いによって、生物(または研究チームが研究しているもの)を他のサンプルと完全に区別できるため、この利点があります。