パターン認識とは
パターン認識は、プログラムされた知識と学習された知識に依存して、データセット内のパターンを認識するシステムの機能です。 これは、複雑なデータ分析が可能なシステムの開発を可能にするため、コンピューターサイエンスの重要な部分です。 これにより、研究者は関心のあるポイントを見つけるためにデータを手動で読み取る必要がないため、データをすばやく分類して意味のある情報を見つけることができます。 パターン認識は、データセット内のエラー、詐欺、その他の問題を発見するのにも役立ちます。
これは、既知のデータベースを使用してシステムが素材を正確に照合できるパターンマッチングとは異なります。 この区別の明確な例は、電子メールフィルターで見ることができます。 多くのWebベースの電子メールアカウントには、スパムフォルダーが付属しています。 電子メールプロバイダーは受信メールをスキャンし、パターン認識を使用してスパムを識別し、このフォルダーにドロップします。 ユーザーは、特定の送信者からのメールまたは特定のコンテンツのメールを特定のフォルダーにドロップするようにクライアントに要求して、自分のメールをフィルタリングすることもできます。
スパムをチェックする行為には、特定の単語の存在、既知の疑わしいインターネットプロトコル(IP)アドレス、および手紙に偽のマークを付けることができるその他の赤いフラグなどの一般的なパターンを認識する機能が必要です。 これは、システムにパターンの一致を単に要求するフィルターよりも高度です。 システムは、パターンに一致する単語または送信者を見つけた場合、電子メールを適切なフォルダーに移動できます。
複雑なアルゴリズムがパターン認識をサポートします。 システムはいくつかの手段を使用して、着信データを調査し、最適な処理方法を決定できます。 疑わしいデータや破損したデータを特定の場所にルーティングしたり、意味のある方法でデータを分類したりするなど、特定の機能を実行するようにプログラムできます。 このシステムは学習可能であり、これをツールとして使用してパターン認識を向上させます。 たとえば、ユーザーが電子メールにスパムのフラグを立てるたびに、システムはその電子メールをスキャンして詳細を調べます。システムは同様の電子メールを受信ボックスに入れるというミスをし続けません。
コンピュータ科学者は、研究室や研究環境で新しいパターン認識技術を開発しています。 これらはさまざまなタスクに適用でき、データと相互作用し、時間とともに変化するニューラルネットワークの構築が必要です。 一部のプログラムは非常に洗練されており、非常に詳細なパターン認識が可能であり、他のプログラムはより単純です。 このようなプログラムは、データの分析に必要な時間数を削減し、数千の保険金請求に及ぶ不正の形での不正の証拠など、人間が見逃す可能性のあるものをキャッチできます。