Kepadatan leksikal mengacu pada rasio kata-kata leksikal dan fungsional dalam teks atau kumpulan teks tertentu. Ini adalah cabang linguistik komputasi dan analisis linguistik. Hal ini terkait dengan kosa kata, kata-kata yang dikenal dari setiap individu dan dapat digunakan untuk membandingkan leksikon lisan dan tertulis dari satu orang. Leksikon berbeda dari kosakata total karena tidak mencakup kata-kata fungsional seperti kata ganti dan partikel.
Kepadatan suatu ujaran atau teks dihitung dengan membandingkan jumlah kata leksikal dan jumlah kata fungsional. Kalimat pendek dan teks kecil dapat dihitung menggunakan aritmatika mental atau dengan penghitungan sederhana. Perbandingan yang lebih besar, katakanlah Charles Dickens atau William Shakespeare, dilakukan dengan memasukkan informasi ke dalam program komputer. Program akan menyaring teks menjadi kata-kata fungsional dan leksikal.
Kepadatan leksikal yang seimbang adalah sekitar 50 persen. Ini berarti bahwa setengah dari setiap kalimat terdiri dari kata-kata leksikal dan setengah dari kata-kata fungsional. Teks dengan kepadatan rendah akan memiliki rasio kurang dari 50:50 dan teks dengan kepadatan tinggi akan memiliki rasio lebih dari 50:50. Naskah akademik dan pemerintah, dokumen yang dipenuhi jargon cenderung menghasilkan kepadatan tertinggi.
Salah satu kelemahan dalam perhitungan kepadatan leksikal adalah tidak memperhitungkan perbedaan bentuk dan kasus kata-kata penyusunnya. Analisis statistik bertujuan hanya dengan mempelajari rasio jenis kata. Itu tidak menghasilkan studi tentang pengetahuan leksikal satu individu. Jika ya, analisis kerapatan leksikal akan membedakan antara bentuk seperti “memberi” dan “memberi”. Secara teoritis, kerapatan leksikal dapat diterapkan pada teks untuk mempelajari frekuensi satuan leksikal tertentu.
Leksikon tertulis seseorang dapat dibantu melalui penggunaan kamus dan tesaurus. Alat-alat tersebut memberikan kata-kata alternatif dan memperjelas makna. Ketika berbicara, seseorang harus mengandalkan kosakata mentalnya saja. Artinya, kerapatan leksikal dapat digunakan sebagai alat untuk membandingkan leksikon lisan dan tulisan. Kepadatan leksikal bahasa lisan cenderung lebih rendah daripada teks tertulis.
Linguistik komputasional adalah area pemodelan statistik dari analisis linguistik. Itu lahir dari Perang Dingin dan keinginan Amerika untuk menggunakan komputer untuk menerjemahkan teks dari Rusia ke Inggris. Untuk melakukannya diperlukan penggunaan matematika, statistik, kecerdasan buatan, dan pemrograman komputer. Masalah terbesar bagi pemrogram adalah membuat komputer memahami tata bahasa dan pragmatik bahasa yang kompleks. Hal ini memunculkan teori China Room bahwa komputer dapat melakukan terjemahan harfiah dari kata-kata, tetapi pada akhirnya tidak dapat memahami bahasa.