역동적 인 시간 뒤틀림은 무엇입니까?
DTW (Dynamic Time Warping)에는 알고리즘이라고하는 계산 방법이 포함되며, 비슷하지만 미묘한 차이가있을 수있는 샘플, 비디오 및 그래픽을 비교합니다. 계산은 일반적으로 샘플의 선형 표현을 공식화하고 시간의 함수로 차이를 측정합니다. 유사성을 식별하기 위해 샘플의 다른 요소를 그리드에 매핑 할 수있는 반면, 함수의 명령은 종종 기호를 사용하여 각 변수를 식별합니다. 예를 들어, 음성 인식은 때때로 다른 속도로 사용되거나 특정 부품이 다르게 발음 되더라도 단어와 일치하는 역동적 인 시간 뒤틀림을 사용합니다.
많은 음성 인식 프로그램은 사람들이 종종 다른 속도로 말하기 때문에 역동적 인 시간 뒤틀림을 사용합니다. 감정이나 다른 요인에 따라 특정 모음 소리가 다르게 구성 될 수 있습니다. 일부 프로그램은 말하기에 상관없이 말하는 단어를 인식 할 수 있습니다. 이러한 이유로 일반적으로 시간 interva의 거리를 추가하는 것은 효과적이지 않습니다.LS 소리를 비교합니다. DTW를 사용하면 각 신호에 대한 다양한 시간별 점을 분석합니다. 이 거리는 왼쪽 하단에서 오른쪽으로 오른쪽으로 실행되는 그리드에서 계산됩니다.
두 샘플의 해당 부분에서 유사성은 Levenshtein 거리를 사용하여 측정 할 수 있습니다. 문자는 한 소스와 다른 소스의 변경 사항을 나타내는 데 사용됩니다. 알고리즘에 대한 솔루션은 일반적으로 두 샘플이 더 다른 숫자입니다. 이 개념은 종종 음성 인식뿐만 아니라 맞춤법 검사 및 유전자 물질 분석에 사용됩니다.
일부 측정에서 주파수 변화는 동적 시간 뒤틀림의 능력을 상쇄 할 수 있습니다. 신호는 주파수에 관계없이 양식을 사용하는 방식으로 계산할 수 있습니다. 변조 된 신호도 문제를 일으킬 수 있지만 점 대신 라인 세그먼트 사이의 거리를 계산하는 그리드는 보상 할 수 있습니다.
시퀀스 정렬T는 일반적으로 수학적이며 일부 컴퓨터 프로그래밍 기술을 완전히 이해하려면 필요합니다. 동적 시간 뒤틀림 알고리즘은 오디오 또는 시각적 샘플의 차이를 현실적으로 계산하기위한 몇 가지 기본 조건에 따라 다릅니다. 샘플을 그리드를 따라 경로로 고려하면 알고리즘은 종종 경로가 되돌릴 수없고 한 번에 한 단계 씩 측정되는 것과 같은 규칙을 따릅니다. 왼쪽 하단에서 오른쪽의 최상위 형식 외에도 측정은 대각선에 가까운 위치로 제한됩니다. 너무 가파르거나 얕은 값은 최종 측정에서 오류를 일으킬 수 있기 때문에 종종 무시됩니다.