エンティティ認識という名前は何ですか?
エンドユーザーの観点からは、データをコンピューターに入力するプロセスは非常に簡単ですが、プロセスは実際に他のいくつかの小さなプロセスを開始します。データの各部分について、コンピューターはその情報を理解している言語に変換する必要があります。コンピューターは、「1」と「0」文字のコレクションが一緒になってコンピューターに何をすべきかを伝えるバイナリとして知られる内部言語を使用します。名前付きエンティティ認識は、翻訳プロセスを入力からデータへと合理化し、コンピューターがコンポーネントパーツに文を壊すのを支援する方法です。
ほとんどのコンピュータープログラムまたはWebページを使用してデータを入力すると、プログラムまたはWebページは一般に、「名前」や「アドレス」フィールドなどの特定の情報を各フィールドに入力するよう求めます。指名されたエンティティ認識プログラムは、そのほとんどを排除し、エンドユーザーがテキストの文字列(文)をより自然なインターフェースを提供できるようにします。プログラムは次のとおりです入力したデータは、より容易に理解できるように断片に並べ替えます。
「ジョーは4ブッシェルのバナナを注文した」などの文を撮ります。従来のプログラムでは、エンドユーザーは「従業員名」フィールドに「ジョー」、「購入タイプ」フィールドに「バナナ」、「数量」フィールドに4つの「」、「ユニット」フィールドに「ブッシェル」を入力する必要があります。指定されたエンティティ認識セットアップでは、エンドユーザーは、書かれたとおりに文全体を入力するだけです。ユーザーが[送信]をクリックするとすぐに、コンピューターは文を細かく並べ替えて、ユーザーが以前使用していたデータの内訳を実行します。
これは、フィールドから設計された従来の入力プログラムよりもはるかに合理化されていますが、1つの大きな欠点があります。翻訳アルゴリズムの潜在的な障害です。あまりインテリジェントな名前付きエンティティ認識アルゴリズムは、特定の方法で文のみを「理解」する場合があります。他のwオードは、従業員が文を言い換えて「バナナの4ブッシェルがジョーによって命じられた」と書いた場合、プログラムは部品を理解して並べ替えるのが難しいかもしれません。このため、エンドユーザーはフィールドにデータを入力する責任がなくなりましたが、システムが最初に見えるほどフリーフォームではありません。