Vad är semantisk teknologi?

Semantisk teknologi är ett begrepp inom datavetenskap som syftar till att föra semantik – innebörden och sammanhanget bakom ord och meningar – till datorernas värld. Ett antal tillvägagångssätt för att implementera konceptet har utvecklats, allt från avancerad artificiell intelligens till formella, maskinläsbara beskrivningar av innehåll. Webben är en central kontaktpunkt för semantisk teknik, även om det kan gynna affärs- och akademiska områden också.

Även om datorer utmärker sig vid matematiska beräkningar, kämpar de med många aspekter av mänskligt språk, särskilt semantik. Ett datorprogram kan besegra även de mest skickliga människorna i ett schackparti, men skulle klara sig dåligt i en triviatävling mot ett barn eftersom det saknar förmågan att korrekt tolka språkets sammanhang, betydelse och finesser i triviafrågorna. Detta har konsekvenser för ett stort utbud av applikationer och tjänster: Utan en grundlig förståelse av sammanhanget kanske en sökmotor inte ger korrekta resultat för ord med flera betydelser, som öken och kyla, och röstigenkänningsprogram kan kämpa med ord som låter som samma, sch som ”häxa” och ”vilken”.

För att ge datorer en djupare insikt i ordens betydelser och relationerna mellan dem, har forskare och förespråkare för semantisk teknologi utarbetat ett antal tillvägagångssätt, av vilka många faller in i två breda kategorier: att förbättra datorernas förmåga att analysera och förstå språk, och göra befintligt innehåll mer maskinläsbart. Exempel på det första tillvägagångssättet inkluderar avancerad artificiell intelligens och parallell bearbetningsteknik utformad för att ge datorer de färdigheter i mänskligt kritiskt tänkande som krävs för att skilja mellan relevant och irrelevant innehåll. Den andra kategorin inkluderar tekniker för att märka innehåll på webben såväl som ontologier – formella beskrivningar av begrepp som kan vara unika för en specialiserad domän, som biologi eller ingenjörskonst.

World Wide Web är en samlingspunkt för semantisk teknologi, och många hoppas kunna se framväxten av en nästa generations webb där kunskap i olika former lättare kan manipuleras, upptäckas och delas av mjukvaruagenter. Denna semantiska webb, som den har blivit känd, föreställdes av krafterna bakom den ursprungliga webben så långt tillbaka som i slutet av 1990-talet. Även om den semantiska webbens fulla potential ännu inte har förverkligats, är aspekter av semantisk teknologi redan vanliga online. Många sökmotorer, till exempel, nu undersöker webbsidor för speciella typer av metadata, en typ av information som beskriver annan information. En typ av metadata kan ange för en sökmotor att en serie nummer är ett telefonnummer eller en fysisk adress, medan en annan typ kan markera ett textblock som en användarrecension av ett företag eller en produkt.

Semantisk teknologi skulle också kunna gynna ett stort antal industrier och akademiska discipliner. Onlineannonsörer letar efter något som kallas semantisk inriktning för att analysera innehållet på en webbsida och leverera annonser som är relevanta för det innehållet. Stora företag och företag är angelägna om att eliminera kompatibilitetsproblem mellan olika informationsteknologisystem med mjukvara och databasarkitekturer som bättre förstår innebörden och sammanhanget av olika innehåll. För akademiker och forskare kan ontologier som är specifika för vissa discipliner göra det möjligt för datorer att hitta och gruppera relevant forskning om mycket specialiserade ämnen, såsom en viss proteinmarkör, vilket gör att människor kan lägga mer tid på att analysera och bedriva forskning snarare än att leta efter den.