Wat is audiomining?
Audio mining wordt meestal gebruikt in spraakherkenningssoftware en muziekanalyse. Deze technologie geeft de gebruiker de mogelijkheid om spraak- of muziekaudio te zoeken die is geanalyseerd op specifieke kenmerken. Bij gebruik in spraakherkenningstechnologie identificeert audiomining gesproken woorden in de audio en zet ze in een doorzoekbaar bestand. Deze functie kan handig zijn voor studenten of studenten in het bedrijfsleven die veel vergaderingen bijwonen, omdat de gebruiker hierdoor gemakkelijker door actuele informatie van spraakpresentaties kan bladeren. Dit type analyse kan ook in muziek worden gebruikt om kenmerken te bepalen zoals beats per minute (BPM), muzikale sleutel en muzikale structuur, informatie die wordt gebruikt om muziek te classificeren.
Bij spraakherkenning, waar de technologie het meest wordt gebruikt, wordt audiomining gebruikt om een akoestisch model te maken. Een akoestisch model programmeert spraakherkenningssoftware om spraakpatronen als woorden te herkennen. Deze technologie is ontwikkeld door audio mining een opname van een gesproken zin, die wordt vergeleken met tekst die overeenkomt met de gesproken zin. De computer gebruikt de informatie om woorden te herkennen wanneer de gebruiker soortgelijke geluiden maakt als die in het akoestische model. Een akoestisch model wordt gebruikt in combinatie met een bestand dat het spraakherkenningsprogramma vertelt welke taal moet worden geïnterpreteerd en welke woordpatronen waarschijnlijk in bepaalde zinnen en situaties worden gesproken.
Muzikanten en muziekluisteraars kunnen beide profiteren van audiomining in muziek. Soms gebruikt muzieksoftware die muziek op genre categoriseert audiomining om de muziek te organiseren. Het proces identificeert en groepeert muziekbestanden met geluidsvergelijkingen die vaak voorkomen in muzikale genres. Hoewel deze technologie het organiseren van muziek en het vinden van nieuwe muziek eenvoudiger kan maken, kan het fouten maken bij het classificeren van nummers met vergelijkbare gemeten kenmerken maar met een ander algemeen geluid. Software voor het analyseren van audio kan nuttig zijn voor muzikanten, met name componisten, omdat de componist hiermee naar specifieke delen van de songstructuur kan springen, inclusief muzikale toetswijzigingen en woorden in de songtekst.
De fabrikant van spraakherkenningssoftware Dragon® verkoopt een programma genaamd AudioMining® dat audiobestanden transcribeert en de bestanden markeert zodat ze naar tekst kunnen worden gezocht. Dragon is een fabrikant van computerlinguïstische programma's, de technische term voor software die is ontworpen om spraak te interpreteren. Audiomining, wanneer gebruikt als twee woorden, is een algemene term die verwijst naar het analyseren van een geluidsbestand voor een bepaalde set audiokenmerken. Andere fabrikanten van software voor audiomining zijn Nuance® en Nexidia®.