ダイナミックタイムワーピングとは何ですか?

ダイナミックタイムワーピング(DTW)には、アルゴリズムと呼ばれる計算方法が含まれ、サウンド、ビデオ、グラフィックスを比較しますが、そのサンプルは微妙な違いがあります。計算は通常、サンプルの線形表現を定式化し、時間の関数として違いを測定します。サンプルのさまざまな要素をグリッドにマッピングして類似性を識別できますが、関数のコマンドは多くの場合、各変数を識別するためにシンボルを使用します。たとえば、音声認識は、異なる速度で話されている場合でも、特定の部分が異なると発音されている場合でも、動的時間のゆがみを使用して単語に合わせます。

多くの音声認識プログラムは、人々がしばしば異なる速度で話すため、動的なタイムワインを使用しています。特定の母音の音は、感情やその他の要因に応じて異なる方法で消費される場合があります。一部のプログラムは、誰が話しているかに関係なく話されている言葉を認識できます。このため、通常、時間間隔で距離を合計することは効果的ではありません音を比較するLS。 DTWでは、各信号のさまざまな時間固有のポイントが分析されます。これらの距離は、左から左から右上まで走るグリッドで計算されます。

2つのサンプルの対応する部分の類似性は、levenshtein距離を使用して測定できます。文字は、あるソースと別のソース間の変化を表すために使用されます。アルゴリズムの解決策は通常、2つのサンプルが異なるほど大きくなります。この概念は、多くの場合、音声認識と呪文のチェックと遺伝物質の分析に使用されます。

いくつかの測定では、周波数の変化は動的なタイムワーピングの能力を相殺する可能性があります。信号は、周波数に関係なくフォームが使用されるように計算できます。変調された信号も問題を引き起こす可能性がありますが、ポイントの代わりにラインセグメント間の距離を計算するグリッドは補正できます。

シーケンスalignmenTは一般に数学的であり、それを完全に理解するにはいくつかのコンピュータープログラミングスキルが必要です。ダイナミックタイムワーピングアルゴリズムは、オーディオサンプルまたは視覚サンプルの違いを現実的に計算するための基本的な条件に依存します。サンプルをグリッドに沿ったパスとして考慮すると、アルゴリズムはしばしば、パスが戻ることができず、一度に1つずつ測定されるなどのルールに従います。左から右上の形式に加えて、測定は対角線に近い場所に限定されています。急勾配または浅い値は、最終測定にエラーを引き起こす可能性があるため、しばしば無視されます。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?