Co to jest analiza mowy?
Analiza mowy jest techniką komputerową służącą do analizy treści mowy. To nie jest po prostu narzędzie do konwersji mowy na technologię. Zamiast tego jest przeznaczony do wykrywania wzorców mowy, w tym zarówno treści, jak i tonu.
Najprostszym zastosowaniem analizy mowy jest zmierzenie, jak często używane są określone frazy. Przed analizą mowy było to możliwe tylko poprzez transkrypcję nagrania, a następnie za pomocą komputera lub ręcznego wyszukiwania w celu wyszukania określonych fraz. Dzięki analizie mowy system komputerowy można wstępnie zaprogramować do „nasłuchiwania” określonego słowa, a nawet do generowania informacji w czasie rzeczywistym.
Istnieje wiele zastosowań takiej technologii. Firma z call center może analizować rozmowy pracowników z klientami w celu wykrycia wzorców reklamacji. Na przykład, chociaż dzienniki połączeń mogą pokazywać, że dany produkt powoduje wiele skarg lub zapytań, analityka mowy może pokazywać, że często wspominany jest określony aspekt produktu, taki jak wiersz instrukcji. Organy ścigania lub służby bezpieczeństwa mogą przeanalizować monitorowane przez siebie połączenia telefoniczne, aby sprawdzić, czy podejrzani wymieniają określone zdanie.
Bardziej zaawansowane analizy mowy można wykorzystać do analizy tonu, a nawet kontekstu. Na przykład firma telemarketingowa zwykle śledzi procent połączeń, które wywołuje sprzedaż, ale niekoniecznie ma statystyki, które pokazują, dlaczego ludzie odrzucili ofertę. Analiza tonu może wykazać, że liczba osób, które odpowiadają gniewnym tonem, jest nieproporcjonalnie wysoka o określonej porze dnia. Może to sugerować, że problem nie polega na tym, że produkt jest nieatrakcyjny, ale raczej na tym, że ludzie denerwują się wezwaniem po określonej godzinie i częściej są wrogo nastawieni do próby sprzedaży, niezależnie od produktu.
Istnieje kilka różnych rodzajów analizy mowy, z których każda zapewnia większą dokładność wyników i zwiększa zarówno czas skanowania mowy, jak i ilość mowy potrzebnej do wykrycia wzorca. Najprostszym typem jest fonetyczny, który rozkłada mowę na poszczególne dźwięki. Choć nie jest skomplikowane, ułatwia wyszukiwanie nowych fraz bez konieczności ponownego skanowania mowy od zera. Narzędzie Spotting od samego początku szuka całych słów. Ciągłe rozpoznawanie mowy o dużym słownictwie ma na celu skuteczne transkrybowanie całej mowy, tak aby cała rozmowa była dostępna do analizy.