Apa itu Transkripsi Otomatis?

Transkripsi otomatis adalah proses menghasilkan transkrip tertulis dari ucapan yang diucapkan atau direkam melalui penggunaan komputer dan tanpa campur tangan manusia secara langsung. Transkripsi otomatis yang akurat memerlukan perangkat lunak transkripsi berkualitas tinggi dan perangkat yang dapat menerima input pendengaran secara akurat. Secara umum, juga perlu bahwa ucapan atau rekaman yang akan ditranskripsikan secara wajar bebas dari distorsi dan interferensi dari kebisingan latar belakang. Upaya juga telah dilakukan untuk menyalin musik dengan menggunakan komputer yang menjalankan perangkat lunak transkripsi khusus. Transkripsi musik melibatkan penulisan not dari bagian musik tertentu, terutama ketika tidak ada notasi yang sudah ada sebelumnya untuk musik itu, seperti halnya dengan solo improvisasi.

Perangkat lunak transkripsi yang baik diperlukan untuk transkripsi otomatis yang berhasil. Perangkat lunak ini bertanggung jawab untuk memproses input pendengaran, memisahkan aliran bahasa yang berkelanjutan menjadi kata-kata yang terpisah, mengenali kata-kata itu, dan merepresentasikannya dengan benar dalam teks. Kegagalan pada setiap tahap proses ini umumnya menghasilkan transkrip yang agak berbeda dari bahan sumber. Perangkat lunak transkripsi otomatis yang baik harus dapat mengenali perbedaan halus antara kata-kata yang serupa dan mengimbangi berbagai gaya dan kecepatan bicara. Aksen yang sulit dipahami cenderung bermasalah bahkan untuk perangkat lunak transkripsi terbaik.

Beberapa orang menggunakan perangkat lunak transkripsi otomatis karena mereka lebih suka dikte daripada mengetik atau menulis teks secara langsung. Beberapa bentuk perangkat lunak transkripsi otomatis sangat baik untuk tujuan ini karena mereka dapat “mempelajari” suara orang-orang yang kata-katanya mereka transkripsikan. Dalam kasus seperti itu, transkripsi otomatis tidak digunakan untuk membuat transkrip ucapan dari berbagai sumber yang berbeda, sehingga perangkat lunak tidak perlu terbuka untuk berbagai pola bicara. Membiarkan proses pengoptimalan ini, yang dapat terjadi selama penggunaan perangkat lunak yang diperpanjang oleh satu orang atau selama kalibrasi awal, dapat sangat meningkatkan akurasi dan potensi kecepatan dikte.

Sayangnya, komputer tidak begitu cocok untuk secara konsisten dan akurat mengenali ucapan manusia seperti halnya manusia. Mereka tidak dapat, misalnya, menggunakan petunjuk kontekstual jika mereka gagal memahami kata tertentu. Karena itu, seringkali manusia perlu mengoreksi transkrip yang dibuat melalui transkripsi otomatis. Kesalahan kecil dalam pemformatan dan berbagai kesalahan dalam transkripsi, dalam banyak kasus, umum terjadi kecuali jika ucapan yang ditranskripsikan sangat jelas. Namun, menggunakan transkripsi terkomputerisasi dapat dengan cepat membuat dasar yang kuat untuk transkrip yang hanya memerlukan intervensi manusia terbatas sebelum diserahkan atau digunakan.