Apa itu Transkripsi Audio?

Transkripsi audio adalah proses mengambil kata-kata yang diucapkan dan membuatnya menjadi teks tertulis. Di masa lalu, seseorang akan duduk dan menulis kata-kata saat diucapkan. Sekarang, rekaman audio dari berbagai jenis dan beberapa metode transkripsi ada. Metode perekaman analog dan digital akan memungkinkan orang yang tidak hadir selama pembicaraan untuk tetap menyalin teks. Selain itu, banyak paket perangkat lunak akan membaca file audio dan dengan cepat mengubahnya menjadi teks tanpa harus benar-benar memutarnya.

Selama bertahun-tahun, transkripsi audio adalah profesi khusus dan membosankan. Orang-orang yang menyalin pidato harus hadir pada saat berbicara, sering kali berarti perusahaan harus mempekerjakan orang yang terlatih dalam teknik-teknik canggih seperti steno. Ini juga membatasi layanan transkripsi bagi mereka yang memiliki akses ke transcriber terlatih.

Dengan penemuan rekaman audio, bidang ini berubah secara dramatis. Dengan rekaman, transcriber bisa bekerja dari mana saja di mana rekaman bisa dikirimkan. Selain itu, transkripsi tidak lagi membutuhkan steno karena rekaman dapat dibalik dan didengarkan berkali-kali. Seorang transcriber juga dapat bekerja untuk banyak klien secara bersamaan, karena dia tidak perlu lagi hadir untuk pidato.

Dengan peningkatan penggunaan komputer dan kecepatan Internet, bidang transkripsi audio sebagian besar tetap sama. File, bukan kaset, sering dikirim melalui email daripada dikirim melalui surat biasa. Kecepatan proses meningkat, tetapi metodenya tidak.

Ini berubah di akhir 90-an dengan meningkatnya penggunaan perangkat lunak pengenalan suara dan dikte. Pekerjaan menyalin semakin banyak ke arah bantuan komputer dan kemudian otomatisasi penuh. Paket perangkat lunak keluar yang dapat membaca informasi di dalam file audio dan menggunakan pola gelombang pembicara untuk membuat versi teks pidato. Ini akan memakan waktu beberapa detik daripada menit atau jam dari transcriber manusia.

Transkripsi audio otomatis komputer memiliki beberapa kekurangan yang sulit untuk diatasi, yang terbesar adalah relatif kurangnya pidato korektif. Ketika seorang transcriber manusia mendengarkan teks, dia dapat memperbaiki sedikit kesalahan dalam ucapan agar lebih mudah dibaca. Sementara beberapa transkripsi adalah kata demi kata, artinya persis seperti yang dikatakan orang tersebut, sebagian besar tidak. Tanpa pidato korektif, manusia sering harus memeriksa transkripsi untuk kesalahan sebelum digunakan.

Kelemahan umum lainnya dari transkripsi audio berbasis komputer terletak pada ucapan manusia. Karena orang memiliki rentang nada dan pola yang sangat besar ketika mereka berbicara, membuat program komputer yang dapat membaca dan menerjemahkan seluruh rentang secara akurat menjadi sangat sulit. Ini berarti bahwa sejumlah kesalahan umum terjadi di hampir semua perangkat lunak transkripsi. Cara paling umum untuk mengatasi kekurangan ini adalah melalui pidato yang dipelajari, di mana program dan satu pembicara bekerja sama cukup sehingga program berfokus pada pola satu orang.