Hvad er dynamisk tidssvingning?

Dynamisk tidssvingning (DTW) involverer en beregningsmetode, kaldet en algoritme, til at sammenligne lyde, video og grafik, der kan være ens, men eksempler der kan have subtile forskelle. Beregningerne formulerer typisk en lineær repræsentation af prøven og måler forskellene som en funktion af tiden. Forskellige elementer i en prøve kan kortlægges på et gitter for at identificere ligheder, mens kommandoer til funktioner ofte bruger symboler til at identificere hver variabel. Talegenkendelse bruger for eksempel undertiden dynamisk tidssvingning til at matche ord, selvom de tales i forskellige hastigheder, eller hvis visse dele udtales forskelligt.

Mange talegenkendelsesprogrammer bruger dynamisk tidssvingning, fordi folk ofte taler i forskellige satser. Visse vokallyde kan annonceres forskelligt afhængigt af følelser eller andre faktorer. Nogle programmer kan genkende ord, der er talt uanset hvem der taler. Af denne grund er det normalt ikke effektivt at tilføje afstandene i tidsintervaller for at sammenligne lyde. Med DTW analyseres forskellige tidspecifikke punkter for hvert signal; disse afstande beregnes på et gitter, der løber fra nederste venstre til øverste højre.

Ligheder i de tilsvarende dele af to prøver kan måles ved hjælp af Levenshtein-afstanden. Bogstaver bruges til at repræsentere ændringerne mellem en kilde og en anden. Løsningen på algoritmen er typisk et større antal, jo mere forskellige er de to prøver. Dette koncept bruges ofte til talegenkendelse samt stavekontrol og analyse af genetisk materiale.

I nogle målinger kan frekvensændringer kompensere for evnen til dynamisk tidssvingning. Signaler kan beregnes på en sådan måde, at deres form bruges uanset frekvens. Modulerede signaler kan også udgøre et problem, men et gitter, der beregner afstande mellem linjesegmenter i stedet for punkter, kan kompensere.

Sekvensjustering er generelt matematisk, og nogle computerprogrammeringsevner er nødvendige for at forstå det fuldt ud. Dynamiske tidssvingningsalgoritmer afhænger af nogle grundlæggende betingelser for realistisk beregning af forskellene mellem lyd- eller visuelle sampler. I betragtning af en prøve som en sti langs et gitter følger algoritmen ofte regler, såsom at stien ikke kan vende tilbage, og at den måles et trin ad gangen. Ud over formatet neden fra venstre til top til højre er målingerne begrænset til placeringer tæt på en diagonal linje. Værdier, der er for stejle eller lave, ses ofte bort fra, fordi de kan forårsage fejl i den endelige måling.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?