음성 합성이란 무엇입니까?
음성 합성은 언어 통신이 인공 장치를 통해 복제되는 프로세스입니다. 텍스트를 음성으로 변환하는 컴퓨터는 일종의 음성 합성기입니다.
초기 형태의 음성 합성은 사람의 성대와 같은 기능을하도록 설계된 기계를 통해 구현되었습니다. 1700 년대에 Wolfgang von Kempelen이 만든 말하기 기계가 그 예입니다. 이 장치를 사용하여 주방 벨로우즈, 백파이프 리드 및 클라리넷 벨을 통해 음성을 제작했습니다. 주방 벨로우즈는 폐처럼 행동하도록 설계되었으며 성대 (성대 부위)는 백파이프 리드를 통해 표현되었습니다. 클라리넷 종은 입으로 사용되었습니다.
장치의 작동이 완전히 수동되었습니다. 오른손은 일련의 레버를 제어하고 왼손은 클라리넷 벨 (입)을 조작했습니다. 덜 코 소리를 내기 위해 '콧 구멍'을 막는 옵션도있었습니다. 어느 쪽이든, 기본 제어 장치가 올바르게 사용되는 한 기계에 공기가 유입되었습니다. 이 기류는 생성 될 사운드 유형을 결정했습니다.
18 세기와 19 세기에 걸친 후속 말하기 기계는이 설정을 유지했지만 개선되었습니다. 예를 들어, 1800 년대 후반, Joseph Faber는 키보드와 페달을 통해 입력을받을 수있는 말하기 기계를 만들었습니다. 인공적인 '얼굴'을 통해 소리가 나오기 때문에 기계는 매우 창의적이었습니다.
20 세기가되었을 때 전자 장치의 혁신으로 인해 음성 합성이 더욱 강력한 방향을 잡을 수있었습니다. 인간의 성대를 흉내내는 전제는 여전히 동일하지만, 입력이 더 정확했기 때문에 20 세기 초 말하기 기계는 더 나은 소리를 낼 수 있습니다.
그러나 컴퓨터가 등장하기 전까지는 음성 합성이 실제로 엔터테인먼트 분야 외부에서 사용될 수있었습니다. 음성 신디사이저는 별도의 기계 대신 소프트웨어에 저장 될 수 있기 때문입니다. 또한 컴퓨터를 보조하여 음성 합성은 다른 형태를 취할 수 있습니다. 사람의 목소리를 소리의 주 소스로 사용합니다.
이러한 형태의 음성 합성은 연결성 (concatenative)으로 알려져 있습니다. 이 과정은 다양한 인간의 음성 녹음을 연결하여 작동합니다. 결과적인 소리는 훨씬 더 자연스럽고 귀에 좋습니다. 이것은 음성 합성법을 사용하는 프로그램과 대조적입니다. 음성 합성은 컴퓨터의 성대 모델을 통해 복제됩니다.
상업용 음성 합성기는 연결 또는 조음 법을 사용할 수 있지만 둘 다 동일한 목표를 달성 할 수 있습니다. 사람들에게 텍스트를들을 수있는 기회를 제공합니다. 이것은 읽기가 방해가되거나 불가능한 상황에서 특히 유용합니다.
비즈니스 세계에서 이러한 상황은 특히 전화 거래에서 매우 일반적입니다. TTS (text-to-speech) 대안이 없으면 비즈니스 소유자는 더 많은 고객 서비스 직원을 고용하는 데 돈을 써야합니다. 모든 것이 컴퓨터에 의해 수행되기 때문에 합성 솔루션은이 문제를 피합니다. 인간이 아닙니다.
합성 언어는 또한 일상 생활에서 특히 장애가있는 개인에게 중요한 역할을합니다. 말하는 시계, 사전 및 기타 장치는 보거나 읽는 데 어려움이있는 사람들이 일을 더 쉽게 해줄 수 있습니다. 합성 된 연설은 전혀 말할 수없는 개인에게 목소리를 줄 수 있습니다. 유명한 물리학자인 스티븐 호킹 (Steven Hawking)이 그 대표적인 예입니다. Lou Gehrig의 질병으로 인해 음소거 되었기 때문에 Hawking은 음성 합성기를 사용하여 사람들과 의사 소통합니다.
다양한 컴퓨터 활동을하는 사람들을 돕기 위해 사용할 수있는 TTS 응용 프로그램도 있습니다. 이러한 유형의 응용 프로그램을 얻으려면 대부분의 사용자가 별도의 소프트웨어를 구입하거나 패치를 다운로드해야합니다. 후자의 옵션은 일반적으로 사용중인 운영 체제 또는 워드 프로세싱 프로그램에 따라 무료입니다. 그러나 별도의 소프트웨어를 구매하기로 결정하면 고품질 시스템에 액세스 할 수 있습니다. 구체적인 예는 Natural Reader 7 및 Text Aloud 2를 통해 확인할 수 있습니다.
궁극적으로, 음성 합성은 인류가 의사 소통하는 방식에 혁명을 일으킨 기술입니다. 어떤 의미에서 그것은 텍스트 자체의 삶을 제공합니다. 또한 세상에 일반적으로 무성 상태였던 훌륭한 개인의 생각을들을 수있는 기회를 제공합니다.