統制語彙とは何ですか?

統制語彙は、リレーショナルデータベース、検索可能なメタデータ、または人が読める単語を使用して情報を後で検索するために使用する他のシステムを構築するときに、以前に合意または承認された用語のみを使用するコンピューターサイエンスおよびコンピュータープログラミングの概念です。 制御された語彙を使用して情報を分類する方法論は、合意された用語がなく、使用されるすべての単語が代わりに重み付けされた関係によって接続される自然言語語彙の概念と直接対照的です。 制御された語彙で使用されるトップレベルの単語に加えて、サポート単語を使用して、シノニムまたはトップレベルの用語に強く関連する他の用語がトップレベルの単語の使用をトリガーできるようにすることができます。 自然言語システムと統制語彙システム間で測定される主な違いは、単語を使用したクエリの結果の関連性、返される情報の量、およびシステム全体の使いやすさです。

単語または用語のコレクションを使用して、任意の情報、絶えず変化する情報、または整理された情報をユーザーがよりアクセスしやすくする場合が多くあります。 インターネット検索エンジン、企業情報データベース、さらにはデジタル研究ライブラリ内の検索用語はすべて、厳密な階層構造ではなく、メタデータ用語で情報を分類できるアプリケーションの例です。 このような状況でオブジェクトを記述するために使用される単語は、より大きな情報プールの一種の検索可能なインデックスを構築します。

管理された語彙の使用の一例は、企業のファイリングシステムを検討するときに見ることができます。 ファイルは、簡単かつ予測可能に取得できるように分類する必要があります。 1つのファイルが自動車を扱う場合、「cars」カテゴリの下にファイルできます。 制御された語彙なしで、他の人が車を扱うファイルも持っている場合、そのファイルは「自動車」という見出しの下に置かれ、1回の検索で2つのファイルを見つけるのが難しくなります。 カテゴリを制御すると、自動車を扱うすべてのファイルは、合意された単一の見出しの下に配置されます。

統制語彙を使用する利点は、情報が予測可能な方法で厳密に記述されることです。 これは、語彙を知っている人なら誰でも効果的かつ正確に情報を検索できることを意味します。 ただし、ボキャブラリーの複雑さは、検索用語を自動的に生成することが不可能ではないにしても困難であり、通常は何らかの人間の介入を必要とすることです。これにより、既存のデータベースを変換して制御されたボキャブラリーを使用することが大きなタスクになります。 ボキャブラリーが十分に大きくない場合、単一のクエリが非常に大量の情報を表示する可能性があり、別のクエリ方法を使用せずにソートすることは実用的ではなくなります。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?