Vad är datorseende?

Datorseende är ett studie- och forskningsområde inom datavetenskap och teknik som fokuserar på datorer och maskiner som kan ta emot och tolka visuell data. Det här områdets problem kan vara så enkelt som att utforma och integrera kameror som fungerar bra med datorer eller så komplexa som att utveckla visuella system som gör det möjligt för datorteknik att interagera med användare. Även om det finns många olika potentiella tillämpningar för datorseende, har medicinsk teknik blivit ett av de mest praktiska och tillgängliga områdena för implementering av sådan visuell teknik. Mycket detaljerade bilder av patienter kan ge en hel del värdefull diagnostisk data som leder till mycket personliga och användbara medicinska data.

Det finns många olika delar av datorseende som ofta måste kombineras för att skapa ett sammanhållet och användbart synsystem. I fall som kräver något mer komplicerat än att återskapa en bild, till exempel, krävs vanligtvis en viss nivå av bildigenkänning eller -detektering. Datorseendeteknologi är utformad för att känna igen specifika visuella signaler, såsom de på mänskliga ansikten, för att fokusera på eller spåra ett givet objekt. Vissa tekniker är utformade för att känna igen text, ofta med syftet att ”översätta” texten från en bildfil till en textfil som kan redigeras och manipuleras.

Datorseende studeras vanligtvis i samband med biologisk syn, den process genom vilken organismer som människor tar emot och tolkar visuella data. De två utbildningsområdena bidrar väsentligt till varandra. Framsteg och utvecklingar inom datorseende kan föreslå möjliga mekanismer genom vilka biologisk syn uppstår. Upptäckter inom biologisk syn kan å andra sidan ge idéer till nya sätt för datorteknik att hantera extern visuell data. Det är inte ovanligt att biologer, datavetare och ingenjörer arbetar tillsammans i projekt som rör dator eller biologisk syn.

Det finns många olika områden, de flesta inom vetenskapen, som regelbundet använder datorseendeteknik, vanligtvis i forskningssyfte. Artificiell intelligens, ett vanligt studieområde inom datavetenskap och teknik, använder visuell teknik för att utforma navigering eller igenkänningssystem för robotik. Datorseendeteknik används ibland inom optik eftersom artificiella visuella system kan fås att ”se” och registrera ett bredare utbud av visuella data än vad organiska visuella system kan. Dessutom bidrar många olika områden till utveckling och implementering av visuell teknologi i datoriserade system. Matematik, till exempel, är en viktig del av programmeringen som ingår i tolkningen av visuella data av datorer.