Apa itu Penambangan Audio?

Penambangan audio biasanya digunakan dalam perangkat lunak pengenalan suara dan analisis musik. Teknologi ini memberikan pengguna kemampuan untuk mencari melalui pidato atau audio musik yang telah dianalisis untuk karakteristik tertentu. Saat digunakan dalam teknologi pengenalan suara, penambangan audio mengidentifikasi kata-kata yang diucapkan dalam audio dan menempatkannya dalam file yang dapat dicari. Fitur ini dapat berguna bagi pelajar atau mereka yang berada di dunia bisnis yang menghadiri banyak pertemuan karena memungkinkan pengguna untuk lebih mudah menelusuri informasi topikal dari presentasi pidato. Jenis analisis ini juga dapat digunakan dalam musik untuk menentukan karakteristik seperti ketukan per menit (BPM), kunci musik, dan struktur musik, informasi yang digunakan untuk mengklasifikasikan musik.

Dalam pengenalan suara, di mana teknologi ini paling sering digunakan, penambangan audio digunakan untuk membuat model akustik. Model akustik memprogram perangkat lunak pengenalan suara untuk mengenali pola bicara sebagai kata. Teknologi ini dikembangkan dengan menambang audio rekaman frasa yang diucapkan, yang dibandingkan dengan teks yang cocok dengan frasa yang diucapkan. Komputer menggunakan informasi untuk mengenali kata-kata ketika pengguna membuat suara yang mirip dengan yang ada di model akustik. Model akustik digunakan dalam kombinasi dengan file yang memberi tahu program pengenalan suara bahasa apa yang harus ditafsirkan dan pola kata apa yang mungkin diucapkan dalam kalimat dan situasi tertentu.

Musisi dan pendengar musik dapat memperoleh manfaat dari penambangan audio dalam musik. Terkadang, perangkat lunak musik yang mengkategorikan musik berdasarkan genre menggunakan penambangan audio untuk mengatur musik. Proses mengidentifikasi dan mengelompokkan file musik dengan kesamaan suara yang sering terjadi dalam genre musik. Meskipun teknologi ini dapat mempermudah pengorganisasian musik dan menemukan musik baru, teknologi ini dapat membuat kesalahan dalam mengklasifikasikan lagu-lagu yang memiliki karakteristik terukur yang serupa tetapi suara keseluruhan yang berbeda. Perangkat lunak penganalisis audio dapat berguna bagi musisi, terutama komposer, karena memungkinkan komposer untuk melompat ke bagian tertentu dari struktur lagu, termasuk perubahan kunci musik dan kata-kata di dalam lirik.

Produsen perangkat lunak pengenalan suara Dragon® menjual program yang disebut AudioMining® yang menyalin file audio dan menandai file tersebut sehingga dapat dicari teksnya. Dragon adalah produsen program linguistik komputer, istilah teknis untuk bidang perangkat lunak yang dirancang untuk menafsirkan ucapan. Penambangan audio, ketika digunakan sebagai dua kata, adalah istilah umum yang mengacu pada analisis file suara untuk serangkaian karakteristik audio yang ditentukan. Produsen perangkat lunak penambangan audio lainnya termasuk Nuance® dan Nexidia®.