Skip to main content

Was ist Spracherkennung?

Die Spracherkennung kann sich auf eine von zwei Arten von Informatik beziehen: forensische Sprachidentifikation oder Sprach-Text-Fähigkeit.Dieser Artikel befasst sich mit der letzteren Definition.

Spracherkennung oder Spracherkennung in diesem Fall ist eine Computertechnologie, die Audioeingabe für die Eingabe von Daten und nicht für eine Tastatur verwendet.In einem Mikrofon beispielsweise führt das gleiche Ergebnis wie manuell mit einer Tastatur zu tippen.Einfach gesagt wurde die Spracherkennungssoftware mit einer internen Datenbank mit erkennbaren Wörtern oder Phrasen entwickelt.Das Programm entspricht der Audio -Signatur der Sprache mit entsprechenden Einträgen in der Datenbank.

Obwohl das Verwandeln von Sprache in Text einfach klingt, ist es eine äußerst schwierige Aufgabe.Das Problem liegt in der praktisch unendlichen Array individueller Sprachmuster und -akzente, die durch die natürliche menschliche Tendenz, Wörter zusammenzuführen, zusammengestellt werden.

Ein Beispiel für die inhärenten Herausforderungen der Spracherkennungssoftware erscheint auf einem T-Shirt, das von Apple-Forschern erstellt wurde.Das Hemd lautet, ich habe Apple geholfen, einen schönen Strand zu zerstören.Wenn es laut gesprochen wird, klingt es so, als würde ich Apple geholfenUntertitel.Jedes Modell verhält sich anders und verfügt über eigene Fähigkeiten und Grenzen. Spracherkennungsprogramme, bei denen der Benutzer die Software schulen muss, um seine speziellen stilisierten Sprachmuster zu erkennen, werden als

lautsprecherabhängige

-Systeme bezeichnet.Personen verwenden diese Art von Programmen zu Hause oder im Büro häufig.E -Mails, Memos, Briefe, Daten und Text können eingegeben werden, indem Sie in ein Mikrofon sprechen.

Einige Spracherkennungssysteme, die als diskrete Sprachsysteme bezeichnet werden, müssen der Benutzer klar und langsam sprechen und Wörter trennen. Kontinuierliche Sprache

Systeme sind so konzipiert, dass sie eine natürlichere Art des Sprechens verstehen.

Diskrete Sprach -Spracherkennungssysteme werden häufig für den Kundenservice verwendet.Das System ist Lautsprecher unabhängig , versteht aber nur einen kleinen Pool von Wörtern oder Phrasen.Der Anrufer erhält die Wahl, eine Frage zu beantworten, normalerweise mit Ja oder Nein.Nach einer Antwort eskaliert das System den Anrufer auf die nächste Ebene.Wenn der Anrufer mit einer eindeutigen Antwort antwortet, ist die automatisierte Antwort normalerweise, sorry, ich habe Sie nicht verstanden.Bitte versuchen Sie es mit einer Wiederholung der Frage und den verfügbaren Antworten erneut.Diese Art der Spracherkennung wird auch als Grammatik -eingeschränkte Erkennung bezeichnet.

Kontinuierliche Sprache ist eine ausgefeiltere Form der Spracherkennungssoftware, wobei der Anrufer natürlich sprechen kann, um ein Problem zu erklären oder einen Dienst anzufordern.Dieses Programm soll Schlüsselwörter oder -phrasen auswählen und eine statistische Beschäftigung darüber machen, was der Kunde will.Das Sprechen hilft eindeutig die Erkennung von Sprachkenntnissen bei der Ermittlung der Notwendigkeit.Diese Art von System hat eine weitaus intensivere Datenbank als diskrete Sprachsysteme und wird auch als natürliche Spracherkennung bezeichnet.Diese Software unterscheidet sich von früheren Modellen insofern, als sie sich nicht darum bemüht, zu verstehen, was gesagt wird, nur um die gesprochenen Wörter zu identifizieren.Da viele Wörter in englischer Sprache gleich klingen, können Fehler leicht gemacht.Große Unternehmen wie Microsoft investieren jedoch in die Spracherkennung, und Bill Gates Own Prognose hat bis zum Jahr 2011 eine kontinuierliche Sprache durch die kontinuierliche Sprache., mit dem ersteren Unternehmen, der das letztere erwirbt.Zu den kleineren Spielern gehören unter anderem Fonix Speech, Aculab und Verbio mit großen UnternehmenWie IBM und der oben erwähnte Microsoft investieren auch in die Technologie.Obwohl viele immer noch der Meinung sind, dass es mehr Probleme ist, Software zu trainieren und Fehler zu korrigieren, als einfach eine Tastatur zu verwenden, kommt es zu einer Zeit, in der die Spracherkennungssoftware diese Lücke wahrscheinlich schließen wird.Die Erweiterung von Tastaturen mit der diskriminierenden Fähigkeit zur Verwendung von Sprache wird wahrscheinlich alltäglich.

Die Spracherkennungssoftware gewinnt an Popularität, da sie anspruchsvoller wird.Es ist besonders nützlich in Business, wo es einen Live -Betreiber für den Trichter von Anrufen, die Verbreitung von Informationen, die Erlaubnis von Bestellungen und andere hoch nützliche Funktionen ersetzen kann.Es wird jedoch auch als Desktop -Anwendung Gunst gewonnen, die durch renommierte Software wie ScanSofts, Dragonnaturallyspeaking und IBMS Vivoice unterstützt werden.