음성 인식이란 무엇입니까?
음성 인식은 법의학 음성 식별 또는 음성 대 텍스트 기능의 두 가지 유형의 컴퓨터 과학 중 하나를 가리킬 수 있습니다. 이 기사는 후자의 정의를 다룬다.
음성 인식 또는이 경우 음성 인식은 키보드 대신 데이터를 입력하기 위해 오디오 입력을 사용하는 컴퓨터 기술입니다. 예를 들어, 마이크에 대고 말하면 키보드로 단어를 수동으로 입력하는 것과 같은 결과가 나타납니다. 간단히 말해서 음성 인식 소프트웨어는 인식 가능한 단어 나 구의 내부 데이터베이스로 설계되었습니다. 이 프로그램은 음성의 오디오 서명을 데이터베이스의 해당 항목과 일치시킵니다.
음성을 텍스트로 바꾸는 것은 쉽지만 매우 어려운 작업입니다. 문제는 사실상 인간이 단어를 함께 실행하는 경향에 의해 혼합 된 사실상 무한한 개별 스피치 패턴과 악센트에있다.
음성 인식 소프트웨어의 고유 한 문제에 대한 그림은 Apple 연구원이 만든 티셔츠에 나타납니다. 그 셔츠는 "애플이 멋진 해변을 난파하는 것을 도왔습니다"라고 읽습니다. 큰 소리로 말할 때, 나는 Apple이 음성을 인식하도록 도와주었습니다.
다양한 음성 인식 소프트웨어 모델은 개인 받아쓰기부터 상업용 자동 통화 라우팅에 이르기까지 장애인 지원에서 스포츠 및 뉴스 이벤트 자막에 이르기까지 다양한 응용 프로그램에 사용됩니다. 각 모델은 다르게 작동하며 자체 기능과 경계가 있습니다.
사용자가 특정 양식화 된 음성 패턴을 인식하도록 소프트웨어를 "훈련"해야하는 음성 인식 프로그램을 스피커 종속 시스템이라고합니다. 개인은 일반적으로 집이나 사무실에서 이러한 유형의 프로그램을 사용합니다. 마이크에 말하면 이메일, 메모, 문자, 데이터 및 텍스트를 입력 할 수 있습니다.
이산 음성 시스템이라고하는 일부 음성 인식 시스템에서는 사용자가 명확하고 천천히 말하고 단어를 분리해야합니다. 지속적인 음성 시스템은보다 자연스러운 말하기 모드를 이해하도록 설계되었습니다.
이산 음성 음성 인식 시스템은 고객 서비스 라우팅에 널리 사용됩니다. 이 시스템은 발표자 독립적 이지만 작은 단어 나 구의 풀만 이해합니다. 발신자는 일반적으로 "예"또는 "아니오"로 질문에 대답 할 수 있습니다. 응답을받은 후 시스템은 발신자를 다음 단계로 이관합니다. 발신자가 고유 한 답변으로 답장을 보내면 자동 응답은 일반적으로 "죄송합니다. 이해가되지 않았습니다. 다시 시도하십시오"라는 질문과 답변이 반복됩니다. 이 유형의 음성 인식은 문법 제약 인식 이라고도합니다 .
연속 음성은보다 복잡한 형태의 음성 인식 소프트웨어로, 발신자는 문제를 설명하거나 서비스를 요청하기 위해 자연스럽게 말할 수 있습니다. 이 프로그램은 핵심 단어 나 문구를 골라 내고 고객이 원하는 것을 통계적으로 가장 잘 추측 할 수 있도록 고안되었습니다. 말하기는 필요를 식별 할 때 음성 인식에 도움이됩니다. 이 유형의 시스템은 신중한 음성 시스템보다 훨씬 더 집중적 인 데이터베이스를 가지고 있으며 자연어 인식 이라고도합니다 .
ASR (자동 음성 인식)은 받아쓰기를 위해 설계된 음성 인식 모델입니다. 이 소프트웨어는 말을 이해하기 위해 노력하지 않고 말하는 단어 만 식별한다는 점에서 이전 모델과 다릅니다. 영어로 된 많은 단어가 비슷하게 들리므로 실수가 쉽게 발생합니다. 그러나 Microsoft와 같은 주요 회사는 음성 인식에 투자하고 있으며 Bill Gates의 예측에 따르면 2011 년까지 지속적으로 말을 이해하는 ASR이 있습니다. ASR 소프트웨어는 종종 디지털 음성 녹음기에서 찾을 수 있습니다.
음성 인식 소프트웨어의 주요 업체는 ScanSoft와 Nuance였으며 이전 회사는 후자를 인수했습니다. 소규모 업체로는 Fonix Speech, Aculab 및 Verbio 등이 있으며 IBM과 같은 주요 기업 및 앞서 언급 한 Microsoft도이 기술에 투자하고 있습니다. 많은 사람들이 여전히 키보드를 사용하는 것보다 소프트웨어를 훈련시키고 실수를 수정하는 것이 더 어렵다고 생각하지만, 음성 인식 소프트웨어가 그 격차를 좁힐 가능성이 높아지고 있습니다. 음성을 사용하는 차별적 인 기능으로 키보드를 보강하는 것이 일반적 일 것입니다.
음성 인식 소프트웨어는 더욱 정교 해짐에 따라 인기를 얻고 있습니다. 특히 실시간 운영자를 대체하여 통화를 유인하고 정보를 유포하며 주문을 받고 기타 유용한 기능을 수행 할 수있는 비즈니스에 특히 유용합니다. 그러나 ScanSoft, DragonNaturallySpeaking 및 IBM의 ViaVoice 와 같은 유명한 소프트웨어를 통해 데스크톱 응용 프로그램으로도 선호되고 있습니다.