O que é o Speech Analytics?
A análise de fala é uma técnica computadorizada usada para analisar o conteúdo da fala. Não é simplesmente uma ferramenta de conversão de voz em tecnologia. Em vez disso, foi desenvolvido para detectar padrões de fala, incluindo conteúdo e tom.
O uso mais simples da análise de fala é medir com que frequência frases específicas são usadas. Antes da análise da fala, isso só era possível transcrevendo uma gravação e usando um computador ou pesquisa manual para procurar frases específicas. Com a análise de fala, um sistema de computador pode ser pré-programado para "ouvir" uma palavra específica e até produzir informações em tempo real.
Existem vários usos para essa tecnologia. Uma empresa com um call center pode analisar as conversas que a equipe mantém com os clientes para detectar padrões nas reclamações. Por exemplo, enquanto os registros de chamadas podem mostrar que um produto específico causa muitas reclamações ou consultas, a análise de fala pode mostrar que um aspecto específico do produto, como uma linha nas instruções, é frequentemente mencionado. Uma autoridade policial ou um serviço de segurança pode analisar as chamadas telefônicas que monitora para verificar se uma frase específica está sendo mencionada pelos suspeitos.
Análise de fala mais sofisticada pode ser usada para analisar tom e até mesmo contexto. Por exemplo, uma empresa de telemarketing geralmente monitora a porcentagem de chamadas efetuadas que resultam em uma venda, mas não necessariamente possui estatísticas para mostrar por que as pessoas recusaram a oferta. A análise do tom pode mostrar que o número de pessoas que respondem com um tom irritado é desproporcionalmente alto a uma determinada hora do dia. Isso pode sugerir que o problema não é tanto que o produto não é atraente, mas que as pessoas ficam irritadas por serem chamadas depois de uma certa hora e são mais propensas a serem hostis a uma tentativa de vendas, independentemente do produto.
Existem vários tipos diferentes de análise de fala, cada um trazendo maior precisão aos resultados e aumentando o tempo necessário para digitalizar a fala e a quantidade de fala necessária para detectar um padrão. O tipo mais simples é fonético, que divide a fala em sons individuais. Embora não seja sofisticado, facilita a pesquisa de novas frases sem ter que redigitalizar a fala do zero. A detecção de palavras-chave procura palavras inteiras desde o início. O reconhecimento contínuo de fala com vocabulário amplo visa efetivamente transcrever toda a fala, para que uma conversa inteira esteja disponível para análise.