Vad är kontrollerat ordförråd?

Kontrollerat ordförråd är ett begrepp inom datavetenskap och datorprogrammering som innebär att man endast använder tidigare överenskomna eller godkända termer när man konstruerar relationsdatabaser, sökbar metadata eller andra system där människoläsbara ord används för att markera information för senare hämtning. Metodiken att använda ett kontrollerat ordförråd för att klassificera information står i direkt kontrast till begreppet naturligt språkvokabulär, där det inte finns några överenskomna termer och alla ord som används istället kopplas samman av viktade relationer. Utöver de överordnade orden som används i ett kontrollerat ordförråd, kan stödord användas så att synonymer eller andra termer som är starkt förknippade med termen på toppnivån kan utlösa användningen av ordet på högsta nivån. De huvudsakliga skillnaderna som mäts mellan naturliga språksystem och kontrollerade ordförrådssystem är relevansen av resultaten av en fråga som använder orden, mängden information som returneras och systemets övergripande användbarhet.

Det finns många tillfällen där en samling ord eller termer används för att göra information som är godtycklig, ständigt förändrad eller oorganiserad mer tillgänglig för användarna. Söktermer inom en sökmotor på Internet, en företagsinformationsdatabas och till och med ett digitalt forskningsbibliotek är alla exempel på applikationer genom vilka information kan kategoriseras med metadatatermer i motsats till en strikt hierarkisk struktur. Orden som används för att beskriva ett objekt i sådana situationer bygger ett slags sökbart index över den större informationspoolen.

Ett exempel på användningen av kontrollerad vokabulär kan ses när man överväger ett arkivsystem för ett företag. Filer måste kategoriseras på ett sätt så att de är lätta och förutsägbara att hämta. Om en fil handlar om bilar kan den arkiveras under kategorin ”bilar”. Skulle en annan person också ha en fil som handlar om bilar, utan ett kontrollerat ordförråd, kan filen placeras under rubriken ”bilar”, vilket gör de två filerna svåra att hitta med en enda sökning. När kategorierna kontrolleras kommer alla filer som handlar om bilar att placeras under en enda överenskommen rubrik.

Fördelen med att använda ett kontrollerat ordförråd är att information strikt beskrivs på ett förutsägbart sätt. Detta innebär att alla som är medvetna om ordförrådet kommer att kunna söka information på ett effektivt och korrekt sätt. En komplikation med vokabulären är dock att söktermerna är svårare, för att inte säga omöjliga, att generera automatiskt och vanligtvis kräver en del mänsklig inblandning, vilket gör det till en stor uppgift att konvertera befintliga databaser till att använda ett kontrollerat ordförråd. Om ordförrådet inte är tillräckligt stort, så finns det också möjligheten att en enskild fråga tar upp en så stor mängd information att det blir opraktiskt att sortera utan att använda en annan frågemetod.