音声分析とは
音声分析は、音声の内容を分析するためのコンピューター化された手法です。 単なる音声から技術への変換ツールではありません。 代わりに、コンテンツとトーンの両方を含む音声のパターンを検出するように設計されています。
音声分析の最も簡単な使用法は、特定のフレーズが使用される頻度を測定することです。 音声分析の前は、録音を書き起こし、コンピューターまたは手動検索を使用して特定のフレーズを探すことによってのみ可能でした。 音声分析を使用すると、特定の単語を「聞く」ようにコンピューターシステムを事前にプログラムし、リアルタイムの情報を生成することもできます。
そのような技術には複数の用途があります。 コールセンターを持つ企業は、スタッフと顧客との会話を分析して、苦情のパターンを検出できます。 たとえば、コールログでは特定の製品が多くの苦情やクエリを引き起こしていることが示されますが、音声分析では、指示の行など、製品の特定の側面が頻繁に言及されることが示されます。 法執行機関またはセキュリティサービスは、監視対象の電話を分析して、容疑者によって特定のフレーズが言及されているかどうかを確認できます。
より洗練された音声分析を使用して、トーンやコンテキストを分析することもできます。 たとえば、テレマーケティング会社は通常、売り上げにつながったコールの割合を追跡しますが、必ずしも人々がオファーを断った理由を示す統計はありません。 トーンを分析すると、特定の時間帯に怒ったトーンで返信する人の数が不釣り合いに多いことがわかります。 これは、問題がそれほど魅力的ではないことを示唆しているのではなく、一定時間後に電話がかかってくることに腹を立て、製品に関係なく販売の試みに対して敵対的である可能性が高いことを示唆する場合があります。
音声分析にはいくつかの異なるタイプがあり、それぞれが結果に精度を追加し、音声のスキャンにかかる時間とパターンの検出に必要な音声の量の両方を増加させます。 最も単純なタイプは音声で、音声を個々の音に分解します。 洗練されていませんが、これにより、スピーチを最初から再スキャンすることなく、新しいフレーズを簡単に検索できます。 キーワードスポッティングは、最初から単語全体を探します。 大語彙連続音声認識の目的は、すべての音声を効果的に書き起こし、会話全体を分析できるようにすることです。