Kata kanonik berarti sesuatu yang sesuai dengan standar yang diterima. Kanonikalisasi — atau kanonikalisasi dalam bahasa Inggris Britania — adalah proses di mana sesuatu dibawa ke dalam kesesuaian dengan standar yang diterima. Di bidang komputer, istilah kanonikalisasi digunakan untuk merujuk pada pemenuhan standar di beberapa area berbeda. Seringkali dianggap sebagai masalah, padahal sebenarnya itu adalah solusi untuk berbagai masalah. Karena itu adalah kata yang panjang, kanonikalisasi disingkat menggunakan huruf pertama dan terakhir dan jumlah huruf di antaranya: c14n.
Kanonikalisasi digunakan dalam TI (Teknologi Informasi) dalam beberapa pengaturan. Ini mengacu pada alamat pengirim email, konstruksi nama file, pengkodean string di Unicode, penggunaan XML (EXtensible Markup Language), dan konstruksi URL (Uniform Resource Locator). Dalam setiap kasus, masalahnya adalah kapasitas untuk beberapa format yang mewakili item yang sama, dengan kanonikalisasi menjadi cara untuk konsistensi dan standarisasi.
Ambil XML sebagai contoh. XML memungkinkan untuk perubahan sintaksis. Ini berarti bahwa dua dokumen yang tidak identik dapat memiliki bentuk kanonik yang sama, dan dengan demikian secara fungsional setara. Spesifikasi Canonical XML dirancang untuk mengatasi hal ini dengan menetapkan metode yang dapat digunakan untuk menetapkan identitas dokumen terpisah. Metode untuk menghasilkan formulir kanonik untuk setiap dokumen XML yang diberikan disebut metode kanonikalisasi XML.
Untuk kanonikalisasi URL, idenya adalah merujuk ke halaman web tertentu secara konsisten dengan satu URL. Contoh paling sederhana adalah dua versi beranda, salah satunya memiliki tiga w dan yang lainnya tidak:
http://www.Förklarade.com
lawan
http://Förklarade.com
Ini menjadi masalah bagi SEO (Search Engine Optimization) karena membagi laporan untuk lalu lintas, yang semuanya sebenarnya menuju ke tempat yang sama. Hasilnya adalah situs dengan beberapa URL untuk halaman yang sama tampaknya berkinerja lebih buruk daripada yang sebenarnya.
Ada masalah lain selain w. Ini termasuk garis miring dan perbedaan antara versi URL dengan huruf besar dan kecil. Matt Cutts dari Google® merekomendasikan untuk mengatasi hal ini dengan menggunakan pengalihan permanen (301) dari semua URL alternatif ke URL yang Anda inginkan, memungkinkan mesin telusur untuk menilai mana yang merupakan URL kanonik.