Wat is dynamische time warping?

Dynamische time warping (DTW) omvat een berekeningsmethode, een algoritme genaamd, om geluiden, video en grafische afbeeldingen te vergelijken die vergelijkbaar kunnen zijn, maar waarvan monsters subtiele verschillen kunnen hebben. De berekeningen formuleren meestal een lineaire weergave van het monster en meten de verschillen als functie van de tijd. Verschillende elementen van een monster kunnen op een raster worden afgebeeld om overeenkomsten te identificeren, terwijl opdrachten voor functies vaak symbolen gebruiken om elke variabele te identificeren. Spraakherkenning gebruikt bijvoorbeeld soms dynamische time warping om woorden te matchen, zelfs als ze op verschillende snelheden worden gesproken of bepaalde delen anders worden uitgesproken.

Veel spraakherkenningsprogramma's gebruiken dynamische time warping omdat mensen vaak met verschillende snelheden spreken. Bepaalde klinkergeluiden kunnen anders worden aangekondigd, afhankelijk van emoties of andere factoren. Sommige programma's kunnen gesproken woorden herkennen, ongeacht wie er spreekt. Om deze reden is het meestal niet effectief om de afstanden in tijdsintervallen op te tellen om geluiden te vergelijken. Met DTW worden verschillende tijdspecifieke punten voor elk signaal geanalyseerd; deze afstanden worden berekend op een raster dat loopt van linksonder naar rechtsboven.

Overeenkomsten in de overeenkomstige delen van twee monsters kunnen worden gemeten met behulp van de Levenshtein-afstand. Letters worden gebruikt om de veranderingen tussen de ene bron en de andere weer te geven. De oplossing voor het algoritme is meestal een groter aantal hoe meer de twee steekproeven verschillen. Dit concept wordt vaak gebruikt voor spraakherkenning, spellingcontrole en analyse van genetisch materiaal.

In sommige metingen kunnen frequentieveranderingen het vermogen van dynamische time warping compenseren. Signalen kunnen zodanig worden berekend dat hun vorm ongeacht de frequentie wordt gebruikt. Gemoduleerde signalen kunnen ook een probleem vormen, maar een raster dat afstanden tussen lijnsegmenten berekent in plaats van punten kan dit compenseren.

Sequentie-uitlijning is over het algemeen wiskundig en sommige computerprogrammeervaardigheden zijn nodig om het volledig te begrijpen. Dynamische time warping-algoritmen zijn afhankelijk van enkele basisvoorwaarden voor het realistisch berekenen van de verschillen tussen audio- of visuele voorbeelden. Overweeg een monster als een pad langs een raster, het algoritme volgt vaak regels, zoals het pad kan niet terugdraaien en dat het stap voor stap wordt gemeten. Naast het formaat linksonder naar rechtsboven zijn metingen beperkt tot locaties in de buurt van een diagonale lijn. Waarden die te steil of ondiep zijn, worden vaak genegeerd omdat ze fouten kunnen veroorzaken in de uiteindelijke meting.

ANDERE TALEN

heeft dit artikel jou geholpen? bedankt voor de feedback bedankt voor de feedback

Hoe kunnen we helpen? Hoe kunnen we helpen?