Apa itu Pemrosesan Ucapan?

Pemrosesan ucapan adalah proses di mana sinyal ucapan ditafsirkan, dipahami, dan ditindaklanjuti. Ini secara khusus mengacu pada pemrosesan ucapan manusia oleh sistem komputerisasi, seperti dalam perangkat lunak pengenalan suara atau program suara-ke-teks. Pemrosesan ucapan penting untuk banyak bidang untuk penggunaan teoretis dan praktis, mulai dari aktivasi dan kontrol suara di telepon hingga pengembangan kecerdasan buatan fungsional dalam ilmu komputer. Interpretasi dan produksi pidato yang koheren keduanya penting dalam pemrosesan pidato; beberapa kekhawatiran memang mendukung satu sama lain, namun, karena kebutuhan aplikasi pemrosesan ucapan sangat beragam.

Pengenalan ucapan adalah salah satu aspek terpenting dari pemrosesan ucapan karena tujuan keseluruhan pemrosesan ucapan adalah untuk memahami dan bertindak atas bahasa lisan. Salah satu aplikasi pengenalan suara yang umum digunakan adalah konversi ucapan-ke-teks sederhana, yang digunakan di banyak program pengolah kata. Banyak aplikasi membutuhkan presisi yang jauh lebih tinggi daripada yang dibutuhkan untuk perangkat lunak konversi ucapan-ke-teks. Ada minat besar, misalnya, dalam menggunakan pengenalan suara di pesawat militer untuk mengurangi tanggung jawab dan ketegangan pilot. Agar presisi dan akurasi dapat dicapai, pembicara perlu mengkalibrasi perangkat lunak pengenalan suara dan gaya bicaranya sendiri.

Pengenalan pembicara, elemen lain dari pengenalan suara, adalah aspek lain yang sangat penting dari pemrosesan suara, meskipun belum diterapkan secara luas seperti pengenalan suara umum. Sementara pengenalan ucapan mengacu secara khusus untuk memahami apa yang dikatakan, pengenalan pembicara hanya berkaitan dengan siapa yang berbicara. Memvalidasi identitas pembicara dapat menjadi fitur keamanan penting untuk mencegah akses tidak sah ke atau penggunaan sistem komputer.

Komponen lain dari pemrosesan ucapan adalah pengenalan suara, yang pada dasarnya merupakan kombinasi dari pengenalan suara dan pembicara. Pengenalan suara terjadi ketika program pengenalan suara memproses ucapan pembicara yang dikenal; program seperti itu umumnya dapat menginterpretasikan pidato pembicara yang dikenal dengan akurasi yang jauh lebih besar daripada pembicara acak.

Topik studi lain di bidang pemrosesan ucapan adalah analisis suara. Analisis suara berbeda dari topik lain dalam pemrosesan ucapan karena tidak terlalu memperhatikan isi linguistik ucapan. Hal ini terutama berkaitan dengan pola bicara dan suara. Analisis suara dapat digunakan untuk mendiagnosis masalah pada pita suara atau organ lain yang berhubungan dengan bicara dengan mencatat suara yang menunjukkan penyakit atau kerusakan. Suara dan pola stres juga dapat digunakan untuk menentukan apakah seseorang mengatakan yang sebenarnya, meskipun penggunaan analisis suara ini sangat kontroversial.