オーディオトランスクリプションとは?

音声転写は、話された単語を取り、それを文章に変換するプロセスです。 過去には、人は座って話しかけられた言葉を書きます。 現在、さまざまなタイプの音声録音といくつかの文字変換方法が存在します。 アナログおよびデジタルの録音方法を使用すると、会話中にいない人でもテキストを書き写すことができます。 さらに、多くのソフトウェアパッケージは、オーディオファイルを読み取り、実際に再生することなく、それらをすばやくテキストに変換します。

長年、音声転写は専門的で退屈な職業でした。 スピーチを転写した人は話すときに立ち会わなければなりませんでした。つまり、多くの場合、企業は速記などの高度な技術の訓練を受けた人を雇わなければなりません。 また、これにより、トランスクリプションサービスは、訓練されたトランスクリプターにアクセスできる人に限定されました。

オーディオ録音の発明により、この分野は劇的に変化しました。 録音を使用すると、録音者は録音を配信できる場所であればどこからでも作業できます。 さらに、録音を反転して何度も聞くことができるため、転写は速記の必要がなくなりました。 彼女はスピーチに出席する必要がなくなったため、1人の転写者が多数のクライアントに対して同時に働くこともできます。

コンピューターの使用とインターネット速度の増加に伴い、音声転写の分野はほぼ同じままでした。 テープではなくファイルは、通常のメールで送信されるのではなく、メールで送信されることがよくありました。 プロセスの速度は増加しましたが、メソッドは増加しませんでした。

これは、音声認識およびディクテーションソフトウェアの使用の増加に伴い、90年代後半に変わりました。 転記の仕事は、コンピューターの支援と、その後の完全自動化にますます向けられていました。 オーディオファイル内の情報を読み取り、スピーカーのウェーブパターンを使用して音声のテキストバージョンを作成できるソフトウェアパッケージが登場しました。 これには、人間の転写者の数分または数時間ではなく、数秒かかります。

コンピューターで自動化された音声文字起こしには、克服するのが困難ないくつかの欠点がありますが、最大のものは修正音声の相対的な欠如です。 人間の転写者がテキストを聞くとき、読みやすくするためにスピーチのわずかな誤りを修正できます。 一部の文字起こしは逐語的なものですが、それはまさにその人が言ったことであり、ほとんどはそうではありません。 修正音声がないと、人間は使用する前に文字起こしのエラーをチェックする必要があります。

コンピュータベースの音声転写の他の一般的な欠陥は、人間の発話そのものにあります。 人々は話すときに幅広い音とパターンを持っているため、その範囲全体を正確に読み取って翻訳できるコンピュータープログラムを作成することは非常に困難です。 これは、ほぼすべてのトランスクリプションソフトウェアで一定量のエラーが一般的であることを意味します。 この欠陥を回避する最も一般的な方法は、学習したスピーチを使用することです。プログラムと1人のスピーカーが十分に連携して、プログラムが1人のパターンに集中できるようにします。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?