Was ist automatische Transkription?
Automatische Transkription ist der Prozess der Erstellung einer schriftlichen Abschrift gesprochener oder aufgezeichneter Sprache unter Verwendung von Computern und ohne direkten menschlichen Eingriff. Für eine genaue automatische Transkription sind eine hochwertige Transkriptionssoftware und ein Gerät erforderlich, mit dem akustische Eingaben präzise empfangen werden können. Im Allgemeinen ist es auch erforderlich, dass die zu transkribierende Sprache oder Aufzeichnung frei von Verzerrungen und Interferenzen durch Hintergrundgeräusche ist. Es wurden auch Versuche unternommen, Musik mit Computern zu transkribieren, auf denen eine spezielle Transkriptionssoftware ausgeführt wird. Bei der Musiktranskription werden die Noten eines bestimmten Musikstücks ausgeschrieben, insbesondere wenn für diese Musik keine Notation vorhanden ist, wie dies bei improvisierten Soli der Fall ist.
Eine gute Transkriptionssoftware ist für eine erfolgreiche automatische Transkription erforderlich. Die Software ist dafür verantwortlich, die akustischen Eingaben zu verarbeiten, einen kontinuierlichen Sprachstrom in separate Wörter aufzuteilen, diese Wörter zu erkennen und sie korrekt im Text darzustellen. Ein Misserfolg in irgendeinem Stadium dieses Prozesses führt im Allgemeinen zu einer Abschrift, die sich etwas vom Ausgangsmaterial unterscheidet. Gute automatische Transkriptionssoftware sollte in der Lage sein, die subtilen Unterschiede zwischen ähnlichen Wörtern zu erkennen und verschiedene Stile und Sprachgeschwindigkeiten auszugleichen. Schwer zu verstehende Akzente sind selbst für die beste Transkriptionssoftware problematisch.
Einige Leute verwenden automatische Transkriptionssoftware, weil sie das Diktieren dem direkten Eingeben oder Schreiben ihres Textes vorziehen. Einige Formen der automatischen Transkriptionssoftware eignen sich besonders gut für diesen Zweck, da sie die Stimmen der Personen "lernen" können, deren Wörter sie transkribieren. In solchen Fällen wird die automatische Transkription nicht verwendet, um Transkripte von Sprache aus verschiedenen Quellen zu erstellen. Daher muss die Software nicht für eine Vielzahl von Sprachmustern offen sein. Durch diesen Optimierungsprozess, der bei längerer Nutzung der Software durch eine Person oder bei einer vorläufigen Kalibrierung auftreten kann, können Genauigkeit und potenzielle Geschwindigkeit des Diktats erheblich gesteigert werden.
Computer sind leider nicht so gut geeignet, menschliche Sprache konsistent und genau zu erkennen wie Menschen. Sie können beispielsweise keine kontextuellen Hinweise verwenden, wenn sie ein bestimmtes Wort nicht verstehen. Als solches ist es oft notwendig, dass ein Mensch Transkripte, die durch automatische Transkription erstellt wurden, Korrektur liest. Kleinere Formatierungsfehler und verschiedene Transkriptionsfehler sind in vielen Fällen häufig, es sei denn, die transkribierte Sprache ist sehr klar. Die Verwendung von computergestützter Transkription kann jedoch schnell eine solide Grundlage für eine Transkription bilden, die vor der Einreichung oder Verwendung nur einen begrenzten menschlichen Eingriff erfordert.