Skip to main content

Что такое динамическая деформация времени?

Динамическая деформация времени (DTW) включает в себя метод расчета, называемый алгоритмом, для сравнения звуков, видео и графики, которые могут быть похожими, но образцы которых могут иметь небольшие различия. Расчеты обычно формулируют линейное представление выборки и измеряют различия как функцию времени. Различные элементы образца могут отображаться в сетке для определения сходства, в то время как команды для функций часто используют символы для идентификации каждой переменной. Например, в распознавании речи иногда используется динамическая деформация времени для сопоставления слов, даже если они произносятся с разной скоростью или определенные части произносятся по-разному.

Многие программы распознавания речи используют динамическое искажение времени, потому что люди часто говорят с разной скоростью. Определенные гласные звуки могут объявляться по-разному в зависимости от эмоций или других факторов. Некоторые программы могут распознавать слова, сказанные независимо от того, кто говорит. По этой причине обычно не эффективно складывать расстояния во временных интервалах для сравнения звуков. С DTW анализируются различные временные точки для каждого сигнала; эти расстояния рассчитываются по сетке, которая проходит снизу слева вверху справа.

Сходства в соответствующих частях двух образцов могут быть измерены с использованием расстояния Левенштейна. Буквы используются для представления изменений между одним источником и другим. Решение алгоритма обычно состоит в том, что чем больше число, тем больше выборка. Эта концепция часто используется для распознавания речи, а также для проверки правописания и анализа генетического материала.

В некоторых измерениях изменения частоты могут компенсировать возможность динамического искажения времени. Сигналы могут быть рассчитаны таким образом, что их форма используется независимо от частоты. Модулированные сигналы также могут представлять проблему, но сетка, которая вычисляет расстояния между отрезками линии вместо точек, может компенсировать это.

Выравнивание последовательности, как правило, математическое, и для его полного понимания необходимы навыки программирования. Алгоритмы динамического искажения времени зависят от некоторых основных условий для реалистичного расчета различий между аудио или визуальными образцами. Рассматривая образец как путь вдоль сетки, алгоритм часто следует правилам, таким как путь не может повернуть назад и что он измеряется по одному шагу за раз. В дополнение к формату от левого нижнего до правого верхнего угла измерения ограничиваются местоположениями, близкими к диагональной линии. Значения, которые являются слишком крутыми или пологими, часто игнорируются, поскольку они могут вызвать ошибки в конечном измерении.