Was ist Audio Mining?

Audio-Mining wird normalerweise in Spracherkennungssoftware und Musikanalyse verwendet. Mit dieser Technologie kann der Benutzer nach Sprache oder Musik suchen, die auf bestimmte Merkmale hin analysiert wurden. Bei Verwendung in der Spracherkennungstechnologie identifiziert Audio Mining gesprochene Wörter im Audio und fügt sie in eine durchsuchbare Datei ein. Diese Funktion kann für Studenten oder Geschäftsleute nützlich sein, die an vielen Besprechungen teilnehmen, da der Benutzer auf diese Weise aktuelle Informationen aus Sprachpräsentationen leichter durchsuchen kann. Diese Art der Analyse kann auch in der Musik verwendet werden, um Merkmale wie Taktschläge pro Minute (BPM), Tonart und Musikstruktur zu bestimmen, Informationen, die zur Klassifizierung von Musik verwendet werden.

In der Spracherkennung, in der die Technologie am häufigsten verwendet wird, wird Audio Mining verwendet, um ein akustisches Modell zu erstellen. Ein akustisches Modell programmiert eine Spracherkennungssoftware, um Sprachmuster als Wörter zu erkennen. Diese Technologie wird durch Audio-Mining einer Aufzeichnung einer gesprochenen Phrase entwickelt, die mit dem zu der gesprochenen Phrase passenden Text verglichen wird. Der Computer verwendet die Informationen, um Wörter zu erkennen, wenn der Benutzer ähnliche Geräusche wie im akustischen Modell abgibt. Ein akustisches Modell wird in Kombination mit einer Datei verwendet, die dem Spracherkennungsprogramm mitteilt, welche Sprache zu interpretieren ist und welche Wortmuster in bestimmten Sätzen und Situationen wahrscheinlich gesprochen werden.

Musiker und Musikhörer können beide vom Audio-Mining in der Musik profitieren. Manchmal verwendet Musiksoftware, die Musik nach Genre kategorisiert, Audio-Mining, um die Musik zu organisieren. Der Prozess identifiziert und gruppiert Musikdateien mit Klangähnlichkeiten, die häufig in Musikgenres auftreten. Obwohl diese Technologie das Organisieren von Musik und das Auffinden neuer Musik vereinfachen kann, kann es zu Fehlern bei der Klassifizierung von Songs mit ähnlichen gemessenen Eigenschaften, aber unterschiedlichem Gesamtklang kommen. Audioanalysesoftware kann für Musiker, insbesondere Komponisten, nützlich sein, da sie es dem Komponisten ermöglicht, zu bestimmten Teilen der Songstruktur zu springen, einschließlich Tonartänderungen und Wörtern in den Texten.

Der Hersteller von Spracherkennungssoftware Dragon® verkauft ein Programm namens AudioMining®, das Audiodateien transkribiert und die Dateien markiert, damit sie nach Text durchsucht werden können. Dragon ist ein Hersteller von Computerlinguistik-Programmen, dem Fachbegriff für Software zur Interpretation von Sprache. Audio-Mining ist, wenn es als zwei Wörter verwendet wird, ein allgemeiner Begriff, der sich auf das Analysieren einer Audiodatei auf einen bestimmten Satz von Audioeigenschaften bezieht. Andere Hersteller von Audio-Mining-Software sind Nuance® und Nexidia®.

Was ist Audio Mining?

War dieser Artikel hilfreich?