Was ist Spracherkennung?
Spracherkennung kann sich auf eine von zwei Arten von Informatik beziehen: forensische Sprachidentifikation oder Sprach-zu-Text-Fähigkeit. Dieser Artikel befasst sich mit der letzteren Definition. In einem Mikrofon beispielsweise erzeugt das gleiche Ergebnis das gleiche Ergebnis wie manuell mit einer Tastatur einzugeben. Einfach gesagt wurde die Spracherkennungssoftware mit einer internen Datenbank mit erkennbaren Wörtern oder Phrasen entwickelt. Das Programm entspricht der Audiosignatur der Sprache mit entsprechenden Einträgen in der Datenbank. Das Problem liegt in der praktisch unendlichen Array individueller Sprachmuster und Akzente, die durch die natürliche menschliche Tendenz, Wörter zusammenzuführenvon Apple -Forschern. Das Shirt lautet: "Ich habe Apple geholfen, einen schönen Strand zu zerstören." Wenn es laut gesprochen wird, klingt es nach , dass ich Apple bei der Erkennung von Sprache geholfen habe. Jedes Modell verhält sich anders und verfügt über eigene Fähigkeiten und Grenzen.
Spracherkennungsprogramme, bei denen der Benutzer die Software "trainieren" muss, um seine speziellen stilisierten Sprachmuster zu erkennen, werden als -Peaker -abhängige -Systeme bezeichnet. Personen verwenden diese Art von Programmen zu Hause oder im Büro häufig. E -Mails, Memos, Briefe, Daten und Text können eingegeben werden, indem Sie in ein Mikrofon sprechen.
Einige Spracherkennungssysteme, die als diskrete Sprachsysteme bezeichnet werden, müssen der Benutzer klar sprechen und sNiedrig und trennen Wörter. kontinuierliche Sprache Systeme sind so konzipiert, dass sie eine natürlichere Art des Sprechens verstehen.
diskrete Sprach -Spracherkennungssysteme werden häufig für den Kundendienstlouting verwendet. Das System ist Lautsprecher unabhängig , versteht jedoch nur einen kleinen Pool von Wörtern oder Phrasen. Der Anrufer erhält die Wahl, eine Frage zu beantworten, normalerweise mit "Ja" oder "Nein". Nach einer Antwort eskaliert das System den Anrufer auf die nächste Ebene. Wenn der Anrufer mit einer eindeutigen Antwort antwortet, lautet die automatisierte Antwort normalerweise: "Entschuldigung, ich habe Sie nicht verstanden; bitte versuchen Sie es erneut", mit einer Wiederholung der Frage und der verfügbaren Antworten. Diese Art der Spracherkennung wird auch als Grammatikbeschränkungserkennung bezeichnet.
Kontinuierliche Sprache ist eine ausgefeiltere Form der Spracherkennungssoftware, bei der der Anrufer natürlich sprechen kann, um ein Problem zu erklären oder einen Dienst anzufordern. Dieses Programm soll Schlüsselwörter oder -phrasen auswählen und eine Statistik erstellenISTICAL BEST-STROUND, was der Kunde will. Das Sprechen hilft eindeutig die Erkennung von Sprachkenntnissen bei der Ermittlung der Notwendigkeit. Diese Art von System hat eine weitaus intensivere Datenbank als diskrete Sprachsysteme und wird auch als natürliche Spracherkennung bezeichnet.
Automatische Spracherkennung (ASR) ist ein Modell der Spracherkennung für Diktat. Diese Software unterscheidet sich von früheren Modellen insofern, als sie sich nicht darum bemüht, zu verstehen, was gesagt wird, nur um die gesprochenen Wörter zu identifizieren. Da viele Wörter in englischer Sprache gleich klingen, können Fehler leicht gemacht. Große Unternehmen wie Microsoft investieren jedoch in Spracherkennung, und Bill Gates 'eigene Vorhersage hat bis zum Jahr 2011 eine kontinuierliche Sprache durch die kontinuierliche Sprache.
dominante Spieler in Spracherkennungssoftware wurden scansoft und nuance, wobei das erstere Unternehmen letztere erworben hat. Zu den kleineren Spielern gehören Fonix Speech, Aculab und Verbio, darunterAndere, mit großen Unternehmen wie IBM und dem oben genannten Microsoft, investieren auch in die Technologie. Obwohl viele immer noch der Meinung sind, dass es mehr Probleme ist, Software zu trainieren und Fehler zu korrigieren, als einfach eine Tastatur zu verwenden, ist eine Zeit, in der die Spracherkennungssoftware diese Lücke wahrscheinlich schließen wird. Die Erweiterung von Tastaturen mit der diskriminierten Fähigkeit zur Verwendung von Sprache wird wahrscheinlich an der Tagesordnung.
Spracherkennungssoftware gewinnt an Popularität, da sie anspruchsvoller wird. Es ist besonders nützlich in Business, wo es einen Live -Betreiber für den Trichter von Anrufen, die Verbreitung von Informationen, die Erlaubnis von Bestellungen und andere hoch nützliche Funktionen ersetzen kann. Als Desktop -Anwendung wird jedoch auch von renommierter Software wie Scansofts, dragonNaturalspeaking und IBMs viavoice ausgefallen.