Vad är ett refererande uttryck?

Ett refererande uttryck är alla ord eller fraser vars syfte är att identifiera en viss person, plats eller sak. Det är i allmänhet ett substantiv, substantivfras eller pronomen. Inom lingvistik är identifiering av refererande uttryck och deras relation till de verkliga objekten som de refererar till en del av studiet av pragmatik, som beskriver förhållandet mellan språk och de verkliga situationer som språket beskriver. Refererande uttrycksgenerering är ett underområde av naturligt språkgenerering, som använder datorer för att producera text som efterliknar mänskligt språk så nära som möjligt.

I grammatiska termer hänvisar alla substantiv till personer, platser, saker eller idéer, men alla är inte hänvisande uttryck. Till exempel innehåller meningen ”En beagle är en hundras,” tre substantiv: ”beagle”, ”ras” och ”hund.” Var och en av dessa hänvisar emellertid till en klass av saker, snarare än till någon specifik sak, och så ingen hänvisar till uttryck. För att formulera det annorlunda så är meningen med meningen att ge information om beaglar i allmänhet snarare än att rikta läsarens uppmärksamhet mot en viss beagle. Å andra sidan, i meningen ”Den hunden är en beagle” är ”den hunden” ett refererande uttryck eftersom det pekar ut en specifik hund och ger information om den.

På engelska kommer ett hänvisande uttryck ofta att innehålla den bestämda artikeln, ”the” eller ett demonstrativt pronomen som ”that” eller ”those”, så att frasen skiljer ett visst objekt från alla andra liknande. Till exempel skulle frasen ”den mammuten” tydligt peka ut en viss mammut och därför vara ett refererande uttryck, medan ”en mammut” inte skulle göra det. Ibland räcker dock inte den grammatiska strukturen av en enstaka mening för att avgöra om en fras är ett refererande uttryck. I meningen ”Mammuten åt främst gräs” kan ”mammuten” syfta på en viss mammut, eller så kan det vara en beskrivning av mammutar i allmänhet, beroende på dess sammanhang.

En praktisk tillämpning av pragmatik är naturlig språkgenerering. För att skapa refererande uttryck som tydligt och entydigt indikerar den avsedda referenten måste programmerare av naturligt språk överväga både grammatiska och kontextuella frågor. Till exempel bör datorgenererat språk som mänskligt språk inte innehålla några pronomen som grammatiskt eller logiskt kan referera till mer än ett substantiv eller verkliga objekt. På detta sätt är generering av refererande uttryck baksidan av anaforaupplösning, som använder olika algoritmer för att bestämma referenser till pronomen i dator- eller mänskligt genererad text.