ソース分離とは
ソース分離とは、信号内の複数のソースを区別することで、1つまたは複数を選択し、他のソースを破棄することです。 これは、人々がパーティーや駅などの環境でさまざまなノイズを区別できるようにする補聴器の開発に重要な意味を持ちます。 存在するソースが多いほど、信号をクリーンアップして意味のあるデータを得ることが難しくなります。 音声認識ソフトウェアを含むアプリケーションもソース分離を使用して、ユーザーにより多くのユーティリティを提供します。
この現象は、いわゆる「カクテルパーティの問題」によって説明されています。 混雑した部屋にいる人は、話している人、ミュージシャン、足音、その他の音源など、無数のノイズの音を分離するのが難しいことがよくあります。 聴力のよい人は、ドリルダウンして、単一のスピーカーなどの特定の音声に集中することができます。 難聴の人は音源分離に問題があり、混雑した騒がしい空間をナビゲートするには補聴器などの支援が必要な場合があります。
補聴器は、音量を上げてすべてを聞き取りやすくするだけではありません。 また、耳にルーティングする前に、いくつかの聴覚処理に信号を送信します。 部屋のさまざまな音を引き離し、聞き手が聞きたいと思う可能性が最も高いものを判別するために、音源分離技術が必要です。 たとえば、近くの誰かの声は、部屋の別の部分での会話よりも上位にランク付けする必要があります。
補聴器が適切にプログラムされていない場合、着用が非常に不快になる可能性があります。 それらは、単一の意味のある信号なしでごちゃ混ぜのノイズを提供する場合があり、周囲で何が起こっているのかを人々が聞くことを不可能にする可能性があります。 悪い信号処理は、人々が快適さのために補助具をオフにするように促し、そもそもそれらを装着する目的を無効にします。 高度な音源分離技術の開発により、補聴器の設計の精度を高めて、音声を引き出したり、他の音を減らしたりすることができます。
さまざまな音源分離アルゴリズムは、補聴器だけでなく、他の聴覚処理デバイスでも使用できます。 たとえば、音声認識システムは、バックグラウンドノイズから音声を引き出すことができる必要があります。 ミュージシャンは音源分離を使用して録音をクリーンアップします。 古い録音の復元には、ジャズバンドのトランペット奏者のような意味のある音を引き出すための信号の処理や、グラスを落とすウェイトレスのような不要なノイズを消すことも含まれます。