Vad är dynamisk tidskakning?

Dynamic Time Warping (DTW) involverar en metod för beräkning, kallad en algoritm, för att jämföra ljud, video och grafik som kan vara liknande men prover kan ha subtila skillnader. Beräkningarna formulerar vanligtvis en linjär representation av provet och mäter skillnaderna som en funktion av tiden. Olika element i ett prov kan mappas på ett rutnät för att identifiera likheter, medan kommandon för funktioner ofta använder symboler för att identifiera varje variabel. Taligenkänning använder till exempel ibland dynamisk tidskakning för att matcha ord även om de talas i olika hastigheter eller vissa delar uttalas annorlunda.

Många programigenkänningsprogram använder dynamisk tidskakning eftersom människor ofta talar i olika takt. Vissa vokaljud kan tillkännages på olika sätt beroende på känslor eller andra faktorer. Vissa program kan känna igen ord som talas oavsett vem som talar. Av denna anledning är det vanligtvis inte effektivt att lägga till avståndet i tidsintervallLS för att jämföra ljud. Med DTW analyseras olika tidsspecifika punkter för varje signal; Dessa avstånd beräknas på ett rutnät som går från botten till vänster till högst till höger.

likheter i motsvarande delar av två prover kan mätas med Levenshtein-avståndet. Bokstäver används för att representera förändringarna mellan en källa och en annan. Lösningen på algoritmen är vanligtvis ett större antal ju mer olika de två proverna är. Detta koncept används ofta för taligenkänning samt stavningskontroll och analys av genetiskt material.

I vissa mätningar kan frekvensförändringar kompensera förmågan hos dynamisk tidskvingning. Signaler kan beräknas på ett sådant sätt att deras form används oavsett frekvens. Modulerade signaler kan också utgöra ett problem, men ett rutnät som beräknar avstånd mellan linjesegment istället för punkter kan kompensera.

sekvens alignmenT är i allmänhet matematisk och vissa datorprogrammeringsfärdigheter behövs för att fullt ut förstå det. Dynamiska tidskvesande algoritmer beror på vissa grundläggande förhållanden för att realistiskt beräkna skillnaderna mellan ljud eller visuella prover. Med tanke på ett prov som en väg längs ett rutnät följer algoritmen ofta regler, till exempel banan kan inte vända tillbaka och att den mäts ett steg åt gången. Förutom det nedre vänstra till högra formatet är mätningarna begränsade till platser nära en diagonal linje. Värden som är för branta eller grunt beaktas ofta eftersom de kan orsaka fel i den slutliga mätningen.

Vad är dynamisk tidskakning?

ANDRA SPRÅK

RELATERADE ARTIKLAR

Hur kan vi hjälpa?