オーディオマイニングとは
オーディオマイニングは、通常、音声認識ソフトウェアおよび音楽分析で使用されます。 このテクノロジーにより、ユーザーは特定の特性について分析された音声または音楽オーディオを検索できます。 音声認識技術で使用される場合、音声マイニングは音声内の話し言葉を識別し、検索可能なファイルに入れます。 この機能は、スピーチプレゼンテーションからトピック情報をより簡単に閲覧できるため、多くの会議に出席する学生やビジネス界の人々に役立ちます。 このタイプの分析は、1分あたりの拍数(BPM)、音楽のキー、音楽の構造、音楽を分類するために使用される情報などの特性を決定するために、音楽でも使用できます。
技術が最もよく使用される音声認識では、音響マイニングを使用して音響モデルを作成します。 音響モデルは、音声認識ソフトウェアをプログラムして、音声パターンを単語として認識します。 この技術は、話し言葉の録音を音声マイニングすることによって開発され、話し言葉に一致するテキストと比較されます。 ユーザーが音響モデルに似た音を出すと、コンピューターはこの情報を使用して単語を認識します。 音響モデルは、特定の文や状況でどの言語を解釈し、どのパターンの単語が話される可能性が高いかを音声認識プログラムに伝えるファイルと組み合わせて使用されます。
ミュージシャンと音楽リスナーはどちらも、音楽のオーディオマイニングの恩恵を受けることができます。 時々、ジャンル別に音楽を分類する音楽ソフトウェアは、オーディオマイニングを使用して音楽を整理します。 このプロセスは、音楽ジャンルで頻繁に発生する音の類似性を持つ音楽ファイルを識別してグループ化します。 このテクノロジーにより、音楽の整理と新しい音楽の検索が容易になりますが、測定特性は似ているが全体の音が異なる曲を分類する際にミスを犯す可能性があります。 オーディオ分析ソフトウェアは、ミュージシャン、特に作曲家にとって便利です。これは、作曲家が音楽のキーの変更や歌詞内の単語など、歌の構造の特定の部分にジャンプできるためです。
音声認識ソフトウェアメーカーDragon®は、AudioMining®と呼ばれるプログラムを販売しています。このプログラムは、オーディオファイルを文字起こしし、テキストを検索できるようにファイルにマークを付けます。 ドラゴンはコンピューター言語プログラムのメーカーであり、音声を解釈するように設計されたソフトウェアの分野の専門用語です。 オーディオマイニングは、2つの単語として使用される場合、一般的な用語で、特定のオーディオ特性のセットについてサウンドファイルを分析することを指します。 オーディオマイニングソフトウェアの他のメーカーには、Nuance®およびNexidia®が含まれます。