음성 인식이란 무엇입니까?
음성 인식은 두 가지 유형의 컴퓨터 과학 중 하나 인 법의학 음성 식별 또는 음성-텍스트 기능을 참조 할 수 있습니다. 이 기사는 후자의 정의를 다룹니다.
음성 인식 또는이 경우 음성 인식은 키보드가 아닌 데이터를 입력하는 데 오디오 입력을 사용하는 컴퓨터 기술입니다. 예를 들어 마이크로 말하면 키보드로 수동으로 단어를 입력하는 것과 동일한 결과가 발생합니다. 간단히 말해서, 음성 인식 소프트웨어는 인식 가능한 단어 또는 문구의 내부 데이터베이스로 설계되었습니다. 이 프로그램은 음성의 오디오 시그니처와 데이터베이스의 해당 항목과 일치합니다.
연설을 텍스트로 바꾸는 것이 쉽지 않지만 매우 어려운 작업입니다. 문제는 자연스럽게 단어를 실행하는 자연스러운 인간 경향에 의해 악화 된 사실상 무한한 개별 음성 패턴과 악센트 배열에 있습니다.
음성 인식 소프트웨어의 고유 도전에 대한 그림은 티셔츠 CRE에 나타납니다.애플 연구원들에 의해 셔츠는 "나는 애플이 멋진 해변을 난파하는 것을 도왔다"고 읽었다. 큰 소리로 말할 때 Apple이 연설을 인식하는 데 도움을주는 것처럼 들립니다.
다양한 음성 인식 소프트웨어 모델은 개인의 받아 들여지는 것에서 상업용 자동 통화 라우팅에 이르기까지 다양한 응용 프로그램에 사용됩니다. 각 모델은 다르게 작동하며 고유 한 기능과 경계가 있습니다.
사용자가 특정 양식화 된 음성 패턴을 인식하기 위해 소프트웨어를 "훈련"해야하는 음성 인식 프로그램을 speaker dependent 시스템이라고합니다. 개인은 일반적으로 집이나 사무실에서 이러한 유형의 프로그램을 사용합니다. 이메일, 메모, 문자, 데이터 및 텍스트는 마이크로 말하면 입력 할 수 있습니다.
Distrete Speech 시스템이라고하는 일부 음성 인식 시스템은 사용자에게 명확하게 말하고 S낮고 단어를 분리합니다. 연속적인 음성 시스템은보다 자연스러운 말하기 모드를 이해하도록 설계되었습니다.
개별 음성 음성 인식 시스템은 고객 서비스 라우팅에 널리 사용됩니다. 시스템은 스피커 독립적이지만 작은 단어 나 구만 이해합니다. 발신자는 일반적으로 "예"또는 "아니오"로 질문에 답할 수있는 선택권이 있습니다. 답변을받은 후 시스템은 발신자를 다음 단계로 확대합니다. 발신자가 고유 한 답변으로 대답하는 경우, 자동화 된 응답은 일반적으로 "죄송합니다. 이해하지 못했습니다. 다시 시도 해주세요." 이러한 유형의 음성 인식은 문법 제한 인식이라고도합니다.
연속적인 음성은보다 정교한 형태의 음성 인식 소프트웨어로 발신자가 자연스럽게 말하면 문제를 설명하거나 서비스를 요청할 수 있습니다. 이 프로그램은 키워드 나 문구를 골라 내고 통계를 만들도록 설계되었습니다.고객이 원하는 것에 대한 Istical Best Grues. 말하기는 필요를 식별하는 데있어 음성 인식을 분명히 도와줍니다. 이 유형의 시스템은 신중한 음성 시스템보다 훨씬 더 집중적 인 데이터베이스를 가지고 있으며 자연어 인식이라고도합니다.
ASR (Automatic Speech Recognition)은 받아 들여지는 음성 인식 모델입니다. 이 소프트웨어는 이전 모델과 다릅니다. 영어의 많은 단어가 비슷하기 때문에 실수가 쉽게 이루어집니다. 그러나 Microsoft와 같은 주요 회사는 음성 인식에 투자하고 있으며 Bill Gates의 자체 예측은 2011 년까지 지속적인 음성을 이해하고 있습니다. ASR 소프트웨어는 종종 디지털 음성 레코더에서 발견됩니다.
.음성 인식 소프트웨어의 지배적 인 플레이어는 Scansoft 및 Nuance이며 이전 회사는 후자를 인수했습니다. 소규모 선수로는 Fonix Speech, Aculab 및 Verbio 등이 있습니다IBM과 같은 주요 기업과 앞서 언급 한 Microsoft 도이 기술에 투자하는 다른 기업들도 있습니다. 많은 사람들이 여전히 키보드를 사용하는 것보다 소프트웨어를 훈련시키는 것이 더 어려워지고 있지만, 음성 인식 소프트웨어가 그 차이를 닫을 때 시간이 다가오고 있습니다. 언어를 사용하는 차별적 인 능력으로 키보드를 보강하는 것은 아마도 흔할 것입니다.
음성 인식 소프트웨어는 더욱 정교 해짐에 따라 인기를 얻고 있습니다. 라이브 운영자를 대체하여 전화를 퍼 뜨리고 정보를 전파하며 주문을 받고 다른 유용한 기능을 수행 할 수있는 비즈니스에서 특히 유용합니다. 그러나 Scansoft 's, DragonnaturallySpeaking 및 IBM의 viavoice 과 같은 유명한 소프트웨어가 도움이되는 데스크탑 응용 프로그램으로도 호의를 얻고 있습니다.