構造採掘とは何ですか?
構造マイニングは、半構造化されたデータソースがスキャンされ、その構造の要素が発見され、強調表示されるデータマイニングの一種です。半構造化されたデータソースは、テーブルの従来のデータベース構造を使用していないが、タグとマーカーを介して情報を分離するセマンティック要素を持っているものです。構造マイニングは、構造の要素を発見するために、データベース、Webサイト、その他多くの形式のコンピューター情報をマイニングするために使用できます。これは、ユーザーが互いにどのように相互作用するか、特定のタグの下で情報を見つける方法を理解するのに役立ちます。また、このマイニングは、ユーザーが書いたルールに基づいてアイテムとは何かを予測するためにも使用できます。
さまざまな種類のデータマイニングがあり、ほとんどは従来の構造化されたソースのマイニングに関心があります。これには、ほとんどのデータベースに典型的なテーブルとノードを使用するソースが含まれます。構造マイニングでは、半構造化データのみが使用されます。この例では、データはWebサイトからのものですまたは、構造を持つが、従来のデータベースルールに準拠していない構造を持つ単純なデータベース。データには、各アイテムを適切に採掘するように設定するタグまたはマーカーが必要です。
半構造化データセットを読み取ることにより、構造マイニングは構造の相互作用を発見することができます。たとえば、各Webサイトにはナビゲーションモデルがあり、ページの相互作用方法を決定するのはこのモデルです。構造をマイニングすることにより、ユーザーはこのナビゲーションがどのように機能するかを発見できます。これは、同様のナビゲーションスキーマを作成するのに役立ちます。
構造マイニングは、マイニングプログラムにルールを作成することにより、アイテムを見つけるためにも使用できます。たとえば、本のデータセットがある場合、ユーザーはインデックスのない本がフィクションとして返されるべきであり、インデックスを持つものがノンフィクションとして返されるべきであるというルールを書くことができます。ほとんどのフィクションの本にはインデックスがないため、このルールはデータが何であるかを高度に予測します。これ組織的な方法を持つが、ユーザーが探しているものに合ったものではない半構造化セットを見るときにユーザーを支援します。
半構造化ユニットの構造を把握した後、ユーザーは通常、別の半構造化ユニットと比較します。ユーザーがビジネスウェブサイトを持っている場合、ナビゲーションとリンクのために別のビジネスWebサイトをマイニングし、彼または彼女のWebサイトがどのように似ているかを確認できます。採掘された情報を比較することにより、ユーザーは構造の効率を高める方法を見つけることができます。