อะคูสติกโมเดลคืออะไร?

รูปแบบอะคูสติกเป็นหลักแผนที่เสียงที่สัมพันธ์กับชุดของคำที่พิมพ์ เทคโนโลยีนี้ใช้ในโปรแกรมรู้จำเสียงพูดเพื่อช่วยให้คอมพิวเตอร์เรียนรู้ที่จะจดจำรูปแบบการพูดของบุคคล รูปแบบอะคูสติกเป็นหนึ่งในสองไฟล์หลักที่จำเป็นในการเรียกใช้โปรแกรมรู้จำเสียง อีกแบบคือรูปแบบภาษาซึ่งบ่งบอกถึงแนวโน้มและรูปแบบคำพูดที่ผู้พูดอาจใช้ แบบจำลองเหล่านี้สร้างขึ้นโดยการเปรียบเทียบรายละเอียดเสียงของไฟล์เสียงพูดกับข้อความของคำพูด

ซอฟต์แวร์รู้จำเสียงเป็นซอฟต์แวร์ที่ออกแบบมาเพื่อรับรู้และคัดลอกหรือตอบสนองต่อคำพูดที่คนพูด ระบบปฏิบัติการหลายระบบได้รับการออกแบบด้วยความสามารถในการรู้จำเสียงพื้นฐานในตัวที่ผู้ใช้สามารถเปิดและปิด ความสามารถในการรู้จำเสียงในระบบปฏิบัติการมักจะทำให้ผู้ใช้สามารถควบคุมคอมพิวเตอร์และพิมพ์คำบนหน้าจอโดยใช้เสียงของเธอ

ในการเข้าถึงซอฟต์แวร์รู้จำเสียงผู้ใช้จำเป็นต้องมีไมโครโฟนเพื่อส่งเสียงของเธอไปยังคอมพิวเตอร์รวมถึงโปรแกรมที่ประมวลผลเสียง ในขณะที่คอมพิวเตอร์หลายเครื่องมีไมโครโฟนในตัวไมโครโฟนชุดหูฟังภายนอกช่วยให้ผู้ใช้ประโยชน์จากเสียงเสียงที่ชัดเจนและอิสระในการเคลื่อนที่ไปรอบ ๆ ห้องขณะพูด แบรนด์ซอฟต์แวร์การรู้จำเสียงแบบสแตนด์อโลนรวมถึงLumenVox®, Loquendo®และDragon®

โปรแกรมรู้จำเสียงพูดส่วนใหญ่มีการเขียนโปรแกรมแบบอะคูสติกที่ทำให้โปรแกรมสามารถจดจำการออกเสียงต่าง ๆ ได้ พวกเขาใช้รูปแบบเสียงของผู้พูดเพื่อระบุคำในการพูด หลายคนได้รับการออกแบบด้วยซอฟต์แวร์ติดตั้งที่สร้างขึ้นเพื่อช่วยผู้ใช้ในการสร้างรูปแบบอะคูสติกที่ออกแบบมาเพื่อตีความเสียงของเธอเอง โปรแกรมรู้จำเสียงพูดขั้นสูงบางโปรแกรมสามารถระบุและตีความหลายภาษาได้บ่อยครั้งที่มีข้อมูลเสียงจำนวนเล็กน้อย โปรแกรมการรู้จำเสียงขั้นสูงยิ่งมีความเป็นไปได้ที่จะตีความคำศัพท์อย่างถูกต้องตามบริบทของมันมากขึ้นรวมถึงตำแหน่งที่ใช้ประโยคในการพูดคำศัพท์

สาขาการศึกษาที่พัฒนาเทคโนโลยีการรู้จำเสียงพูดเรียกว่าภาษาศาสตร์เชิงคอมพิวเตอร์ ภาษาศาสตร์เชิงคอมพิวเตอร์เกี่ยวข้องกับการศึกษาและการออกแบบที่สร้างซอฟต์แวร์ที่ตั้งโปรแกรมให้เข้าใจคำพูดของมนุษย์ ฟิลด์นี้มักจะรวมข้อมูลจากการศึกษาจิตวิทยาเพื่อสร้างแบบจำลองอะคูสติกที่สามารถตีความคำพูดได้อย่างแม่นยำมากขึ้น

คำว่า "อคูสติก" โดยทั่วไปหมายถึงสิ่งที่เกี่ยวข้องกับเสียง แม้ว่ารุ่นอะคูสติกมักใช้ในการรู้จำเสียง แต่ก็สามารถใช้ในการฟังเพลงได้ แบบอะคูสติกของแทร็กเพลงสามารถระบุคุณสมบัติเช่นจังหวะต่อนาที, ปุ่มดนตรีหรือสนามที่โดดเด่นในเพลง โปรแกรมคอมพิวเตอร์สามารถใช้ข้อมูลนี้เพื่อระบุแทร็กเพลงหรือสามารถใช้เพื่อกำหนดประเภทของเพลงที่มีการแบ่งประเภทเพลง นอกจากนี้ยังใช้แบบจำลองทางเสียงในสาขาการศึกษาที่เรียกว่า Psychoacoustics ซึ่งนักวิจัยหวังว่าจะได้เรียนรู้การสร้างโครงสร้างดนตรีที่ส่งผลกระทบต่อสมอง