동적 시간 왜곡이란?

DTW (Dynamic Time Warping)는 유사하지만 샘플의 미묘한 차이가있을 수있는 사운드, 비디오 및 그래픽을 비교하기 위해 알고리즘이라고하는 계산 방법을 포함합니다. 계산은 일반적으로 샘플의 선형 표현을 공식화하고 시간의 함수로 차이를 측정합니다. 함수의 명령은 종종 기호를 사용하여 각 변수를 식별하는 동안 샘플의 다른 요소를 그리드에 매핑 할 수 있습니다. 예를 들어, 음성 인식은 다른 속도로 말하거나 특정 부분이 다르게 발음 된 경우에도 동적 시간 왜곡을 사용하여 단어를 일치시킵니다.

사람들이 종종 다른 속도로 말하기 때문에 많은 음성 인식 프로그램은 동적 시간 왜곡을 사용합니다. 감정이나 다른 요인에 따라 특정 모음 소리가 다르게 나타날 수 있습니다. 어떤 프로그램은 누가 말하고 있든지 말을 인식 할 수 있습니다. 이 때문에 일반적으로 시간 간격으로 거리를 더하여 사운드를 비교하는 것은 효과적이지 않습니다. DTW를 사용하면 각 신호에 대한 다양한 시간별 포인트가 분석됩니다. 이 거리는 왼쪽 하단에서 오른쪽 상단으로 이어지는 그리드에서 계산됩니다.

레 벤슈 테인 거리를 사용하여 두 샘플의 해당 부분의 유사성을 측정 할 수 있습니다. 문자는 한 출처와 다른 출처 사이의 변경 사항을 나타내는 데 사용됩니다. 알고리즘에 대한 솔루션은 일반적으로 두 샘플이 더 많을수록 더 큰 수입니다. 이 개념은 종종 음성 인식 및 맞춤법 검사 및 유전 물질 분석에 사용됩니다.

일부 측정에서 주파수 변경은 동적 시간 왜곡 기능을 상쇄 할 수 있습니다. 신호는 주파수에 관계없이 형태가 사용되는 방식으로 계산 될 수 있습니다. 변조 된 신호도 문제가 될 수 있지만 점 대신 선분 사이의 거리를 계산하는 그리드가 보상 할 수 있습니다.

서열 정렬은 일반적으로 수학적이며,이를 완전히 이해하기 위해서는 일부 컴퓨터 프로그래밍 기술이 필요하다. 동적 시간 왜곡 알고리즘은 오디오 또는 시각적 샘플 간의 차이를 사실적으로 계산하기위한 몇 가지 기본 조건에 따라 다릅니다. 샘플을 그리드를 따라 경로로 고려하면 알고리즘은 종종 경로를 되돌릴 수없고 한 번에 한 단계 씩 측정되는 규칙과 같은 규칙을 따릅니다. 왼쪽 하단에서 오른쪽 상단 형식 외에도 측정 값은 대각선에 가까운 위치로 제한됩니다. 너무 가파르거나 얕은 값은 최종 측정에서 오류를 일으킬 수 있기 때문에 종종 무시됩니다.

동적 시간 왜곡이란?

이 문서가 도움이 되었나요?