Qu'est-ce que la transcription audio?
La transcription audio consiste à prendre des mots parlés et à les transformer en texte écrit. Dans le passé, une personne s'asseyait et écrivait des mots tels qu'ils étaient prononcés. Il existe maintenant des enregistrements audio de divers types et plusieurs méthodes de transcription. Les méthodes d'enregistrement analogique et numérique permettront à une personne qui n'est pas présente lors de la conversation de toujours transcrire le texte. En outre, de nombreux logiciels lisent les fichiers audio et les convertissent rapidement en texte sans avoir à les lire.
Pendant de nombreuses années, la transcription audio était un métier spécialisé et fastidieux. Les personnes qui transcrivaient le discours devaient être présentes au moment de parler, ce qui signifiait souvent que les entreprises devaient embaucher des personnes formées aux techniques avancées telles que la sténographie. Cela limitait également les services de transcription aux personnes ayant accès à un transcripteur qualifié.
Avec l'invention des enregistrements audio, ce domaine a radicalement changé. Avec un enregistrement, le transcripteur pourrait travailler à partir de n’importe quel endroit où l’enregistrement pourrait être livré. De plus, la transcription n’a plus besoin de sténographie car l’enregistrement peut être inversé et écouté plusieurs fois. Un seul transcripteur pourrait également travailler simultanément pour une multitude de clients, car elle n'avait plus besoin d'être présente pour les discours.
Avec l’augmentation de l’utilisation des ordinateurs et de la vitesse de l’Internet, le domaine de la transcription audio est resté sensiblement le même. Les fichiers, plutôt que les bandes, étaient souvent envoyés par courrier électronique au lieu d’être envoyés par courrier normal. La vitesse du processus a augmenté, mais les méthodes n'ont pas.
Cela a changé à la fin des années 90 avec l'utilisation croissante des logiciels de reconnaissance vocale et de dictée. Le travail de transcription s’orientait de plus en plus vers l’assistance informatique puis vers l’automatisation complète. Des logiciels capables de lire les informations contenues dans un fichier audio et d'utiliser les motifs d'onde du locuteur pour créer une version texte d'un discours sont apparus. Cela prendrait quelques secondes plutôt que les minutes ou les heures d'un transcripteur humain.
La transcription audio automatisée par ordinateur présente quelques défauts difficiles à surmonter, dont le plus important est l’absence relative de discours correctif. Lorsqu'un transcripteur humain écoute un texte, il peut corriger de légères erreurs dans le discours afin de le rendre plus lisible. Bien qu'une transcription soit mot pour mot, c'est-à-dire qu'elle correspond exactement à ce que la personne a dit, la plupart ne le sont pas. Sans discours correctif, un humain devra souvent vérifier la transcription avant de l'utiliser.
L’autre défaut commun de la transcription audio par ordinateur réside dans le langage même des humains. Etant donné que les gens ont une vaste gamme de tonalités et de motifs quand ils parlent, il est extrêmement difficile de créer un programme informatique capable de lire et de traduire avec précision toute la gamme. Cela signifie qu'une certaine quantité d'erreur est commune à presque tous les logiciels de transcription. La façon la plus courante de remédier à cette faille consiste à utiliser un langage appris, dans lequel le programme et un seul intervenant collaborent suffisamment pour que le programme se concentre sur les caractéristiques de la personne.