Hva er dynamisk tidssving?

Dynamisk tidssvingning (DTW) involverer en beregningsmetode, kalt en algoritme, for å sammenligne lyder, video og grafikk som kan være like, men eksempler som kan ha subtile forskjeller. Beregningene formulerer typisk en lineær representasjon av prøven, og måler forskjellene som en funksjon av tiden. Ulike elementer i en prøve kan kartlegges på et rutenett for å identifisere likheter, mens kommandoer for funksjoner ofte bruker symboler for å identifisere hver variabel. Talegjenkjenning, for eksempel, bruker noen ganger dynamisk tidssvingning for å matche ord selv om det snakkes med forskjellige hastigheter eller hvis visse deler uttales annerledes.

Mange talegjenkjenningsprogrammer bruker dynamisk tidssvingning fordi folk ofte snakker med forskjellige priser. Visse vokallyder kan bli annerkjent forskjellig avhengig av følelser eller andre faktorer. Noen programmer kan gjenkjenne ord som er talt uansett hvem som snakker. Av denne grunn er det vanligvis ikke effektivt å legge opp avstandene i tidsintervaller for å sammenligne lyder. Med DTW analyseres forskjellige tidspesifikke punkter for hvert signal; disse avstandene beregnes på et rutenett som går fra venstre til venstre til høyre.

Likheter i de tilsvarende delene av to prøver kan måles ved å bruke Levenshtein-avstanden. Brev brukes til å representere endringene mellom en kilde og en annen. Løsningen på algoritmen er vanligvis et større antall, jo mer forskjellige er de to prøvene. Dette konseptet brukes ofte til talegjenkjenning, så vel som stavekontroll og analyse av genetisk materiale.

I noen målinger kan frekvensendringer kompensere for evnen til dynamisk tidssvingning. Signaler kan beregnes på en slik måte at formen deres brukes uavhengig av frekvens. Modulerte signaler kan også utgjøre et problem, men et rutenett som beregner avstander mellom linjesegmenter i stedet for punkter kan kompensere.

Sekvensjustering er vanligvis matematisk, og det kreves noen dataprogrammeringsevner for å forstå det fullt ut. Dynamiske tidssvingningsalgoritmer er avhengige av noen grunnleggende betingelser for å realistisk beregne forskjellene mellom lyd- eller visuelle sampler. Tatt i betraktning en prøve som en bane langs et rutenett, følger algoritmen ofte regler, for eksempel at banen ikke kan slå tilbake og at den måles ett trinn av gangen. I tillegg til nederst fra venstre til høyre-høyre format, er målingene begrenset til steder nær en diagonal linje. Verdier som er for bratte eller grunne blir ofte sett bort fra fordi de kan forårsake feil i den endelige målingen.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?