Ses Madenciliği Nedir?

Ses madenciliği genellikle konuşma tanıma yazılımlarında ve müzik analizlerinde kullanılır. Bu teknoloji, kullanıcıya belirli özellikler için analiz edilmiş konuşma veya müzik sesleri arasında arama yapma olanağı sağlar. Konuşma tanıma teknolojisinde kullanıldığında, ses madenciliği ses içindeki sözlü kelimeleri tanımlar ve bunları aranabilir bir dosyaya koyar. Bu özellik, öğrenciler veya iş dünyasında çok sayıda toplantıya katılanlar için yararlı olabilir çünkü kullanıcının konuşma sunumlarından topikal bilgilere daha kolay göz atmasını sağlar. Bu tür analizler, dakikada müzik ritmi (BPM), müzik anahtarı ve müzik yapısı, müzik sınıflandırmak için kullanılan bilgiler gibi özellikleri belirlemek için müzikte de kullanılabilir.

Teknolojinin en sık kullanıldığı konuşma tanımada, akustik bir model oluşturmak için ses madenciliği kullanılmaktadır. Akustik model, konuşma tanıma yazılımını konuşma kalıplarını sözcük olarak tanımak için programlar. Bu teknoloji, sesli madencilik tarafından, konuşulan cümleyle eşleşen metinle karşılaştırılan bir sözlü cümlenin kaydı olarak geliştirilmiştir. Bilgisayar, akustik modeldeki seslere benzer sesler çıkardığında kelimeleri tanımak için bilgileri kullanır. Akustik model, konuşma tanıma programına hangi dilin yorumlanacağını ve belirli cümlelerde ve durumlarda hangi sözcük kalıplarının söylenmesi gerektiğini söyleyen bir dosyayla birlikte kullanılır.

Müzisyenler ve müzik dinleyicileri, müzikteki ses madenciliğinden yararlanabilir. Bazen, müziği türe göre kategorize eden müzik yazılımı, müziği düzenlemek için ses madenciliği kullanır. İşlem, müzik türlerinde sıklıkla meydana gelen ses benzerliklerine sahip müzik dosyalarını tanımlar ve gruplandırır. Bu teknoloji, müzik düzenlemeyi ve yeni müzik bulmayı kolaylaştırabilmesine rağmen, benzer ölçülmüş özelliklere sahip ancak farklı genel sesler içeren şarkıları sınıflandırırken hata yapabilir. Ses analiz yazılımı, müzisyenler için, özellikle besteciler için faydalı olabilir, çünkü bestecinin şarkı yapısındaki belirli müzik parçalarına atlamasına, şarkıların içindeki müzikal anahtar değişimleri ve kelimeler dahil olmak üzere, izin verir.

Konuşma tanıma yazılımı üreticisi Dragon®, AudioMining® adlı, ses dosyalarını kopyalayan ve dosyaları metin için aranabilecek şekilde işaretleyen bir program satıyor. Dragon, konuşmayı yorumlamak için tasarlanmış yazılım alanı için kullanılan teknik terim olan bilgisayar dilbilim programları üreticisidir. Ses madenciliği, iki kelime olarak kullanıldığında, belirlenmiş bir ses karakteristiği seti için bir ses dosyasının analizini ifade eden genel bir terimdir. Diğer ses madenciliği yazılımı üreticileri Nuance® ve Nexidia®'yı içerir.