Hvad er lydminedrift?

Audio mining anvendes normalt i talegenkendelsessoftware og musikanalyse. Denne teknologi giver brugeren mulighed for at søge gennem tale- eller musiklyd, der er analyseret for specifikke egenskaber. Når det bruges i talegenkendelsesteknologi, identificerer lydudvinding talte ord i lyden og placerer dem i en søgbar fil. Denne funktion kan være nyttig for studerende eller dem i erhvervslivet, der deltager i mange møder, fordi det giver brugeren lettere at gennemse aktuelle oplysninger fra talepræsentationer. Denne type analyse kan også bruges i musik til at bestemme karakteristika som beats per minut (BPM), musikalsk nøgle og musikalsk struktur, information, der bruges til at klassificere musik.

Ved talegenkendelse, hvor teknologien oftest bruges, anvendes audio mining til at skabe en akustisk model. En akustisk model programmerer talegenkendelsessoftware til at genkende talemønstre som ord. Denne teknologi er udviklet ved lydindvinding af en optagelse af en talt sætning, som sammenlignes med tekst, der matcher den talte sætning. Computeren bruger informationen til at genkende ord, når brugeren opretter lignende lyde som dem i den akustiske model. En akustisk model bruges i kombination med en fil, der fortæller talegenkendelsesprogrammet, hvilket sprog der skal fortolkes, og hvilke mønstre af ord der sandsynligvis vil blive talt i visse sætninger og situationer.

Musikere og musiklyttere kan begge drage fordel af lydmining i musik. Nogle gange bruger musiksoftware, der kategoriserer musik efter genre, audio mining til at organisere musikken. Processen identificerer og grupperer musikfiler med lydligheder, der ofte forekommer i musikalske genrer. Selvom denne teknologi kan gøre det lettere at organisere musik og finde ny musik, kan den gøre fejl, der klassificerer sange, der har lignende målte egenskaber, men som har en generel lyd. Audioanalysesoftware kan være nyttigt for musikere, især komponister, fordi det giver komponisten mulighed for at hoppe til bestemte dele af sangstrukturen, herunder musikalske nøgleændringer og ord inden for teksterne.

Producenten af ​​talegenkendelsessoftware Dragon® sælger et program kaldet AudioMining®, som transkriberer lydfiler og markerer filerne, så de kan søges efter tekst. Dragon er en producent af computer-sproglige programmer, den tekniske betegnelse inden for software, der er designet til at fortolke tale. Når lydanvendelse bruges som to ord, er det et generelt udtryk, der refererer til analyse af en lydfil for et bestemt sæt lydegenskaber. Andre producenter af audio mining software inkluderer Nuance® og Nexidia®.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?