名前付きエンティティの認識とは何ですか?
エンドユーザーの観点からは、コンピューターにデータを入力するプロセスは非常に単純ですが、実際には他のいくつかの小さなプロセスを開始します。 データの各部分について、コンピューターはその情報を理解できる言語に翻訳する必要があります。 コンピューターは、バイナリーと呼ばれる内部言語を使用します。この言語では、「1」と「0」の文字の集まりが一緒になって、コンピューターに何をすべきかを伝えます。 名前付きエンティティの認識は、入力からデータへの翻訳プロセスを合理化する方法であり、コンピューターが文章をコンポーネント部分に分割するのを支援します。
ほとんどのコンピュータープログラムまたはWebページを使用してデータを入力する場合、プログラムまたはWebページでは通常、「名前」フィールドや「住所」フィールドなどの特定の情報を各フィールドに入力するよう求められます。 名前付きエンティティ認識プログラムはそのほとんどをなくし、エンドユーザーがテキストの文字列(文)を入力できるようにし、より自然なインターフェイスを提供します。 プログラムは、入力されたデータを取得し、それをより簡単に理解できる部分に分類します。
「ジョーはバナナを4ブッシェル注文しました」などの文を取ります。 従来のプログラムでは、エンドユーザーは「従業員名」フィールドに「ジョー」、「購入タイプ」フィールドに「バナナ」、「数量」フィールドに「4」、「ブッシェル」を入力する必要がありました。 「ユニット」フィールド。 名前付きエンティティの認識設定では、エンドユーザーは文章全体を書かれているとおりに入力するだけです。 ユーザーが[送信]をクリックすると、コンピューターは文を断片に並べ替え、ユーザーが以前使用していたのと同じデータの内訳を実行します。
これは、フィールドから設計された従来の入力プログラムよりもはるかに合理化されていますが、1つの大きな欠点があります。変換アルゴリズムの潜在的な障害です。 あまり知性のない名前付きエンティティ認識アルゴリズムは、特定の1つの方法でのみ文を「理解」する場合があります。 言い換えると、従業員が文を言い換えて「バナナの4ブッシェルをジョーが注文しました」と書いた場合、プログラムは部品の理解とソートが困難になる可能性があります。 このため、エンドユーザーはフィールドにデータを入力する責任を負いませんが、システムが最初に見えるほど自由形式ではありません。