Apa itu Model Akustik?

Model akustik pada dasarnya adalah peta suara dalam kaitannya dengan serangkaian kata yang dicetak. Teknologi ini digunakan dalam program pengenalan suara untuk membantu komputer belajar mengenali pola bicara seseorang. Model akustik adalah salah satu dari dua file utama yang diperlukan untuk menjalankan program pengenalan suara; yang lainnya adalah model bahasa, yang menunjukkan kemungkinan kata-kata dan pola bicara yang mungkin digunakan oleh pembicara. Model-model ini dibuat dengan membandingkan detail suara dari file audio yang diucapkan dengan teks dari kata-kata yang diucapkan.

Perangkat lunak pengenalan ucapan adalah perangkat lunak yang dirancang untuk mengenali dan menyalin atau menanggapi kata-kata yang diucapkan seseorang. Banyak sistem operasi dirancang dengan kemampuan pengenalan suara dasar bawaan yang dapat dihidupkan dan dimatikan oleh pengguna. Kemampuan pengenalan suara pada sistem operasi biasanya memberikan pengguna kemampuan untuk mengontrol komputer dan mengetik kata-kata di layar menggunakan suaranya.

Untuk mengakses perangkat lunak pengenalan suara, pengguna memerlukan mikrofon untuk mengirimkan suaranya ke komputer, ditambah program yang memproses suara. Sementara banyak komputer memiliki mikrofon internal, mikrofon headset eksternal memungkinkan pengguna mendapatkan manfaat dari suara suara yang lebih jernih dan kebebasan untuk bergerak di sekitar ruangan saat berbicara. Merek perangkat lunak pengenalan suara mandiri termasuk LumenVox®, Loquendo®, dan Dragon®.

Sebagian besar program pengenalan suara memiliki pemrograman model akustik yang memungkinkan program mengenali variasi pengucapan. Mereka menggunakan pola suara pembicara untuk mengidentifikasi kata-kata dalam pidato. Banyak yang dirancang dengan perangkat lunak pengaturan yang dibuat untuk membantu pengguna membuat model akustik yang dirancang untuk menafsirkan suaranya sendiri. Beberapa program pengenalan suara tingkat lanjut dapat mengidentifikasi dan menafsirkan berbagai bahasa, seringkali dengan sedikit informasi suara. Semakin maju program pengenalan suara, semakin besar kemungkinan untuk menafsirkan kata secara akurat berdasarkan konteksnya, termasuk di mana dalam kalimat sebuah kata diucapkan.

Bidang kajian yang mengembangkan teknologi pengenalan suara disebut linguistik komputasional. Linguistik komputasional melibatkan studi dan desain yang menciptakan perangkat lunak yang diprogram untuk memahami ucapan manusia. Bidang ini sering menggabungkan informasi dari studi psikologi untuk menciptakan model akustik yang dapat lebih akurat menafsirkan ucapan.

Kata “akustik” umumnya mengacu pada segala sesuatu yang berhubungan dengan suara. Meskipun model akustik paling sering digunakan dalam pengenalan suara, model ini juga dapat digunakan dalam musik. Model akustik trek musik dapat mengidentifikasi properti seperti ketukan per menit, kunci musik, atau nada dominan dalam musik. Informasi ini dapat digunakan oleh program komputer untuk mengidentifikasi trek musik, atau dapat digunakan untuk secara longgar menentukan genre di mana musik tersebut kemungkinan dikategorikan. Model akustik juga digunakan dalam bidang studi yang disebut psikoakustik, di mana para peneliti berharap untuk belajar menyusun musik yang dapat diprediksi mempengaruhi otak.