어쿠스틱 모델이란?
음향 모델은 본질적으로 일련의 인쇄 된 단어와 관련된 음성 맵입니다. 이 기술은 컴퓨터가 사람의 음성 패턴을 인식하는 것을 배우도록 돕기 위해 음성 인식 프로그램에 사용됩니다. 음향 모델은 음성 인식 프로그램을 실행하는 데 필요한 두 가지 주요 파일 중 하나입니다. 다른 하나는 언어 모델로, 화자가 사용할 수있는 단어 및 음성 패턴을 나타냅니다. 이 모델은 음성 오디오 파일의 사운드 세부 사항을 음성 단어의 텍스트와 비교하여 만들어집니다.
음성 인식 소프트웨어는 사람이 말하는 단어를 인식하고 전사하거나 응답하도록 설계된 소프트웨어입니다. 많은 운영 체제는 사용자가 켜고 끌 수있는 기본 음성 인식 기능이 내장되어 있습니다. 운영 체제의 음성 인식 기능은 일반적으로 음성을 사용하여 컴퓨터를 제어하고 화면에 단어를 입력 할 수있는 기능을 제공합니다.
음성 인식 소프트웨어에 액세스하려면 컴퓨터에 음성을 전달할 수있는 마이크와 사운드를 처리하는 프로그램이 필요합니다. 많은 컴퓨터에 마이크가 내장되어 있지만, 외부 헤드셋 마이크를 사용하면보다 선명한 음성 사운드를 누릴 수 있으며 대화하는 동안 자유롭게 회의실을 자유롭게 이동할 수 있습니다. 독립형 음성 인식 소프트웨어 브랜드로는 LumenVox®, Loquendo® 및 Dragon®이 있습니다.
대부분의 음성 인식 프로그램에는 프로그램이 발음의 변화를 인식 할 수있는 음향 모델 프로그래밍이 있습니다. 화자의 음성 소리에 패턴을 사용하여 말의 단어를 식별합니다. 대부분은 사용자가 자신의 음성을 해석하도록 설계된 음향 모델을 만드는 데 도움이되는 설정 소프트웨어로 설계되었습니다. 일부 고급 음성 인식 프로그램은 종종 소량의 사운드 정보로 여러 언어를 식별하고 해석 할 수 있습니다. 음성 인식 프로그램이 발전할수록 문장에서 단어가 말하는 위치를 포함하여 문맥에 따라 단어를 정확하게 해석 할 가능성이 높아집니다.
음성 인식 기술을 개발하는 연구 분야를 전산 언어학이라고합니다. 전산 언어학은 인간의 언어를 이해하도록 프로그램 된 소프트웨어를 만드는 연구와 디자인을 포함합니다. 이 분야는 종종 심리학 연구의 정보를 통합하여 음성을보다 정확하게 해석 할 수있는 음향 모델을 만듭니다.
"음향"이라는 단어는 일반적으로 소리와 관련된 모든 것을 의미합니다. 음향 모델은 음성 인식에 가장 많이 사용되지만 음악에도 사용할 수 있습니다. 음악 트랙의 음향 모델은 분당 비트 수, 음악 키 또는 음악의 지배적 인 음정과 같은 속성을 식별 할 수 있습니다. 이 정보는 컴퓨터 프로그램에서 음악 트랙을 식별하는 데 사용되거나 음악이 분류 될 가능성이있는 장르를 느슨하게 결정하는 데 사용될 수 있습니다. 음향 모델은 또한 심리 음향학이라는 연구 분야에서 사용되며, 연구자들은 뇌에 예측 가능한 영향을 미치는 음악을 구조화하는 방법을 배우기를 희망합니다.