知識抽出とは何ですか?
知識抽出とは、さまざまな情報源を利用して、まとまりのある知識バンクを作成するプロセスです。 このアプローチの一部として、抽出は多くの場合、構造化されたソースと非構造化されたソースの両方を利用します。 成功すると、知識抽出により、特定のプログラムで簡単に読み取りおよび解釈できる堅実なデータが得られ、エンドユーザーはその正式な知識を希望する目的に活用できます。
知識抽出のプロセスでは、いくつかの異なるソースを利用できます。 構造化されたソースの範囲内で、データはさまざまな種類のリレーショナルデータベースまたは何らかの種類の拡張可能なマークアップ言語またはXMLソースから抽出されます。 画像、さまざまな形式のワードプロセッサドキュメント、スプレッドシート、メモ帳スタイルのプログラムでキャプチャされたテキストなどの非構造化ソースは、抽出プロセスの一部として利用できます。 ソースが知識抽出プロセスの管理に使用されているプログラムで読み取り可能な限り、ソースは、抽出によって進められているプロジェクトの可能性を拡大し、生成された最終的な知識を使用可能にするソースとして使用できます。 。
知識抽出で発生する一般的なアプリケーションがいくつかあります。 よくある例の1つは、非構造化ソースからデータをキャプチャし、何らかのタイプの構造化知識ソースに組み込む機能です。 リレーショナルデータベースで見つかったデータを抽出し、それを使用して新しいドキュメントを作成したり、電子ドキュメントを使用してデータをリレーショナルデータベースにインポートしたりすることは、このタイプの抽出が手動でデータを入力することなく正式な知識の共有を促進するもう1つの例ですそれはすでに他のソースから入手可能です。 いくつかの新しい形式での既存の知識のこの再利用は、多くのシナリオでしばしば非常に役立ち、既存のソースでは不可能だった方法でその知識を利用することを可能にします。 このようにして、ユーザーは、正式な知識の元のホームに関連するものだけでなく、さまざまなアプリケーションに理想的なソースを作成できます。
データ抽出を使用すると、特定の目的に使用できる新しいソースを作成する方法として、データを簡単にインポートおよびエクスポートできる広大なデータウェアハウスを利用できます。 これらの新しく作成されたソースは、データウェアハウス内の場所を見つけ、最終的には、新しい使用ニーズを満たすために使用される新しい抽出の作成に使用できます。 これを念頭に置いて、知識抽出は、現在手元にあるすべてのリソースを最大限に活用し、その正式な知識の共有に関連する多くのタスクを簡素化するのに役立つ非常に役立つツールと見なすことができます。