音声認識とは何ですか?
言語がどのように聞こえ、解釈され、理解されるかを理解することは、言語認識を研究する人々の目標です。音響、音素、構文、その他の特性などの音声認識のさまざまな要素は、音声がどのように処理され、理解されるかのロードマップを提供するのに役立ちます。音声認識で使用される聴覚プロセスを超えて、視覚的な手がかりも調査する必要があります。
2つのプロセスは、言語の処理と理解に関して、人間が着信音響信号を処理する方法を説明しようとします。人間が保存された言語スキルとキューを使用して、欠落している音声情報を記入すると、トップダウン処理と見なされます。保存された情報がないため、人間はボトムアップ処理を使用させます。ボトムアップ処理は、乳児を研究することで実証できます。乳児がどのように耳を傾け、言語の音響に反応します。
耳の内臓は、理解のために音声に関連する音声を脳の側頭ローブに伝達するように働きます。振動協会スピーチの音響を備えたTedは、鼓膜を通って聴覚小余りまで渡され、内耳、co牛、有毛細胞への振動が続きます。この時点で、聴覚神経はニューロンから信号を拾い上げ始め、ピッチやトーンを含む音声特性の最初の解釈の原因となる脳の領域に情報を送信し始めます。
音声に関連する音は音声の音響と見なされます。これらの音は、人間の声道の振動によって生成されます。声帯によって生成された各文字と音には、その形状を変えるために声帯が必要です。
音素は、言語の同様の音を区別するのに役立ちます。音声と言葉を構成する音節よりも小さい音素は、音声認識に寄与します。言語の重複を構築するために使用される音素やその他の音声は、区別するのが困難です。音声の各セグメントの音はです前後に来る音の影響を受け、この困難につながります。
口の形成や表情を含む視覚的な手がかりは、音声信号と音を特定するのに役立ちます。いくつかの研究では、顔と視覚の合図を変えると、提供される視覚的な手がかりと知覚される音に影響します。これは、音声知覚の分野でMcGurk効果として知られています。
言語の知覚に関連する言語の議論では、いくつかの追加の用語が使用されています。構文は、文法としても知られる単語の組み合わせとして理解されます。セマンティクスとは、メッセージ自体の意味を指します。構文とセマンティクスを理解することは、音声認識の理解と研究のさらなるのに役立ちます。