Was ist ein akustisches Modell?

Ein akustisches Modell ist im Wesentlichen eine Karte der Stimme in Bezug auf eine Reihe gedruckter Wörter. Diese Technologie wird in Spracherkennungsprogrammen verwendet, um einem Computer zu lernen, die Sprachmuster einer Person zu erkennen. Ein akustisches Modell ist eine der beiden Hauptdateien, die für die Ausführung eines Spracherkennungsprogramms erforderlich sind. Das andere ist das Sprachmodell, das wahrscheinliche Wörter und Sprachmuster anzeigt, die vom Sprecher verwendet werden können. Diese Modelle werden erstellt, indem die Tondetails einer gesprochenen Audio -Datei mit dem Text der gesprochenen Wörter verglichen werden. Viele Betriebssysteme sind mit integrierten grundlegenden Spracherkennungsfunktionen ausgelegt, die der Benutzer ein- und ausschalten kann. Spracherkennungsfunktionen für Betriebssysteme geben dem Benutzer normalerweise die Möglichkeit, den Computer zu steuern und Wörter mithilfe ihrer Stimme auf dem Bildschirm einzugeben.Mikrofon, um ihre Stimme auf den Computer zu bringen, sowie ein Programm, das den Sound verarbeitet. Während viele Computer integrierte Mikrofone haben, ermöglicht ein externes Headset-Mikrofon dem Benutzer den Vorteil eines klareren Sprachklangs und die Freiheit, sich während des Sprechens im Raum zu bewegen. Die Marken für eigenständige Spracherkennungssoftware umfassen Lumenvox®, Loquendo® und Dragon®.

Die meisten Spracherkennungsprogramme haben eine akustische Modellprogrammierung, mit der das Programm Variationen in der Aussprache erkennen kann. Sie verwenden Muster im Klang der Stimme des Sprechers, um Wörter in der Sprache zu identifizieren. Viele sind mit Setup -Software entwickelt, die dem Benutzer dabei helfen, ein akustisches Modell zu erstellen, das ihre eigene Stimme interpretieren soll. Einige erweiterte Spracherkennungsprogramme können mehrere Sprachen identifizieren und interpretieren, häufig mit einer kleinen Menge an soliden Informationen. Je fortschrittlicher ein Spracherkennungsprogramm ist, desto mehr LiKely Es ist, Wörter basierend auf seinem Kontext genau zu interpretieren, einschließlich dessen, wo in einem Satz ein Wort gesprochen wird.

Der Studienbereich, der Spracherkennungstechnologie entwickelt, wird als Computer -Linguistik bezeichnet. Die Computer -Linguistik umfasst Studien und Design, das Software schafft, die zum Verständnis der menschlichen Sprache programmiert ist. Dieses Gebiet enthält häufig Informationen aus dem Studium der Psychologie, um akustische Modelle zu erstellen, die die Sprache genauer interpretieren können.

Das Wort "akustisch" bezieht sich im Allgemeinen auf alles, was mit Klang zu tun hat. Obwohl akustische Modelle am häufigsten bei der Spracherkennung verwendet werden, können sie auch in der Musik verwendet werden. Ein akustisches Modell eines Musik -Tracks kann Eigenschaften wie Beats pro Minute, die Musikschlüssel oder dominante Stellplätze in der Musik identifizieren. Diese Informationen können von einem Computerprogramm verwendet werden, um einen Musik -Track zu identifizieren, oder es kann verwendet werden, um das Genre, in das die Musik wahrscheinlich kategorisiert ist, locker zu bestimmen. Akustische Modelle werden auch in einem Feld von verwendetStudie namens Psychoacustics, in der die Forscher hoffen, Musik zu strukturieren, die vorhersehbar das Gehirn beeinflusst.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?