Datorseende (CV) är, mycket enkelt uttryckt, en metod för att känna igen och tolka bilder med hjälp av kameror och datorer. Datorseendeteknik används inom ett antal områden och består av ett antal specialiserade hård- och mjukvaruapplikationer. Vissa typer av datorseendeteknik inkluderar högupplösta kameror, individuellt designade datorsystem och specialsensorer eller filter för både kameran och datorn.
Charged coupled device (CCD)-kameror tillhandahåller typiskt bildutdata för datorseendeteknik. CCD-kameror kan vara rundstrålande, pan-tilt-zoom eller rak sikt. Kameror utvecklade av Carnegie Mellon University kända som CMUcams är en typ av datorseendeteknologi som kombinerar en videokamera med en mikrokontroller. Detta möjliggör inbyggt stöd för enkel bildbehandling. Robotics använder ofta stereoseende och kombinerar två kameror som är kalibrerade för att fånga en exakt konvergerad bild.
Datorerna som används för datorseendeteknologi kräver speciella delar som dotterkort, även kända som dotterkort, och processorkort utformade för att påskynda designprocessen. Sensorer som mycket storskalig integration (VLSI) och infraröda (IR) sensorer ingår för att underlätta olika uppgifter, som mörkerseende. Termiska sensorer hanterar värmeigenkänning.
Frame grabbers är implementerade för att ta en analog bild som skickas till datorn från CCD-kameran eller annan bildfångande enhet och konvertera den till en digital bild i gråskala eller färg. Tvådimensionella (2D) eller tredimensionella (3D) linjeskannrar ingår också, som hjälper till med klumpdetektering, rörelseavkänning och kantdetektering. I vissa applikationer, som tuffa miljöer, kan specialkapslingar användas för att skydda hårdvaran.
Robotik och säkerhets- och övervakningsindustrin är två av de primära områdena som använder datorseendeteknik. Den medicinska industrin och astronomer spelar också en stor roll. CCD-kameror eller liknande tillhandahåller basbilden för datorn att bearbeta enligt önskemål från programmeraren. Bilder kan bearbetas generellt, vilket ger enkel kantdetektering i 2D, vilket möjliggör rörelseuppskattning, eller i 3D, som sedan möjliggör formextraktion.
Alla olika stilar och konfigurationer av datorseendeteknik använder algoritmer som utvecklats specifikt för CV-ändamål. Dessa algoritmer hjälper till med uppgifter som att förbättra bilder och hitta linjer som matchar dem med modeller. Användningen av algoritmer håller nere mängden data som ska behandlas till ett minimum genom att bara extrahera den information som behövs för en dedikerad uppgift.
Medan datorseende ständigt utvecklas i takt med teknologin, spelar den redan en viktig roll inom de områden som nämns här och många andra. Blobdetektering och ansiktsigenkänning är viktiga i säkerhetsapplikationer. Robotics förlitar sig på datorseendeteknologi för att framgångsrikt manövrera obemannade eller autonoma fordon. De nuvarande tillämpningarna av tekniken kan bara vara början på saker som kan göras med detta framväxande fält för datorseende.