Co je to dynamické časové deformace?

Dynamické časové deformace (DTW) zahrnuje metodu výpočtu nazývanou algoritmus pro porovnání zvuků, videa a grafiky, které mohou být podobné, ale vzorky, které mohou mít jemné rozdíly. Výpočty obvykle formulují lineární reprezentaci vzorku a měří rozdíly jako funkci času. Různé prvky vzorku mohou být mapovány na mřížce pro identifikaci podobností, zatímco příkazy pro funkce často používají symboly k identifikaci každé proměnné. Například rozpoznávání řeči někdy používá dynamické časové deformace, aby odpovídala slovům, i když se mluví různými rychlostmi nebo určité části jsou vyslovovány odlišně.

Mnoho programů rozpoznávání řeči používá dynamické časové deformace, protože lidé často mluví různými rychlostmi. Některé zvuky samohlásky mohou být ohlášeny odlišně v závislosti na emocích nebo jiných faktorech. Některé programy mohou rozpoznat slova mluvená bez ohledu na to, kdo mluví. Z tohoto důvodu obvykle není účinné přidat vzdálenosti v časové internaLS pro porovnání zvuků. S DTW jsou analyzovány různé časově specifické body pro každý signál; Tyto vzdálenosti se počítají na mřížce, která probíhá od vlevo dole do pravého horního pravého. Dopisy se používají k reprezentaci změn mezi jedním zdrojem a druhým. Řešením algoritmu je obvykle větší číslo, tím více jsou dva vzorky. Tento koncept se často používá pro rozpoznávání řeči a kontrolu pravopisu a analýzy genetického materiálu.

V některých měřeních mohou změny frekvence kompenzovat schopnost dynamického časového deformace. Signály lze vypočítat tak, aby se jejich forma použila bez ohledu na frekvenci. Modulované signály mohou také představovat problém, ale mřížka, která vypočítává vzdálenosti mezi segmenty linky místo bodů, může kompenzovat.

Sekvenční zarovnáníT je obecně matematické a k plnému porozumění jsou zapotřebí některé dovednosti počítačového programování. Algoritmy dynamické časové deformace závisí na některých základních podmínkách pro realistické výpočet rozdílů mezi zvukovými nebo vizuálními vzorky. Vzhledem k tomu, že vzorek jako cestu podél mřížky, algoritmus často dodržuje pravidla, jako je cesta, nemůže se vrátit zpět a že se měří jeden krok najednou. Kromě levého dolního doletu do pravého pravého formátu jsou měření omezena na místa v blízkosti diagonální linie. Hodnoty, které jsou příliš strmé nebo mělké, jsou často ignorovány, protože mohou způsobit chyby při konečném měření.

Co je to dynamické časové deformace?

JINÉ JAZYKY

SOUVISEJÍCÍ ČLÁNKY

Jak můžeme pomoci?