Vad är ljudbrytning?
Ljudbrytning används vanligtvis i taligenkänningsprogram och musikanalys. Denna teknik ger användaren möjlighet att söka igenom tal eller musikljud som har analyserats för specifika egenskaper. När den används i taligenkänningsteknologi identifierar ljudbrytning talade ord i ljudet och placerar dem i en sökbar fil. Den här funktionen kan vara användbar för studenter eller personer i näringslivet som deltar i många möten eftersom det gör att användaren lättare kan bläddra bland aktuell information från talpresentationer. Denna typ av analys kan också användas i musik för att bestämma egenskaper som beats per minute (BPM), musikalisk nyckel och musikalisk struktur, information som används för att klassificera musik.
Vid taligenkänning, där tekniken oftast används, används ljudbrytning för att skapa en akustisk modell. En akustisk modell programmerar taligenkänningsprogramvara för att känna igen talmönster som ord. Denna teknik är utvecklad genom ljudbrytning av en inspelning av en talad fras, som jämförs med text som matchar den talade frasen. Datorn använder informationen för att känna igen ord när användaren ljuder liknande ljud som i den akustiska modellen. En akustisk modell används i kombination med en fil som talar för taligenkänningsprogrammet vilket språk som ska tolkas och vilka ordmönster som sannolikt kommer att talas i vissa meningar och situationer.
Musiker och musiklyssnare kan båda dra nytta av ljudbrytning i musik. Ibland använder musikprogramvara som kategoriserar musik efter genre ljudbrytning för att organisera musiken. Processen identifierar och grupperar musikfiler med ljudlikheter som ofta förekommer i musikaliska genrer. Även om denna teknik kan göra organisering av musik och hitta ny musik lättare, kan den göra misstag som klassificerar låtar som har liknande uppmätta egenskaper men olika generellt ljud. Ljudanalysprogramvara kan vara användbar för musiker, särskilt kompositörer, eftersom det gör det möjligt för kompositören att hoppa till specifika delar av sångstrukturen, inklusive musikaliska nyckelförändringar och ord i texterna.
Tillverkaren av taligenkänningsprogrammet Dragon® säljer ett program som heter AudioMining® som transkriberar ljudfiler och markerar filerna så att de kan söka efter text. Dragon är en tillverkare av datalingvistikprogram, den tekniska termen för programvarufältet för att tolka tal. Ljudbrytning, när den används som två ord, är en allmän term som hänvisar till att analysera en ljudfil för en bestämd uppsättning ljudegenskaper. Andra tillverkare av ljudbrytningsprogramvara inkluderar Nuance® och Nexidia®.