Vad är datorvisionsalgoritmer?
Datorvisionsalgoritmer är matematiska modeller som försöker hjälpa en dator att tolka en bild. Människor tolkar bilder på många komplexa sätt, där datorns faktiska förmåga att tolka bilder är extremt begränsad, även med den senaste tekniken. Datorvisionsalgoritmer hjälper också till att göra framsteg på de sätt som datorer kan få specifika typer av data från en bild.
Utmaningarna för ingenjörer som använder datorvisionsalgoritmer är att vision bygger på en serie avdrag relaterade till okända element i bilden. Forskare kallar detta för ett "omvändt problem" och säger att endast komplexa fysikbaserade sannolikhetsmodeller kan hjälpa tekniken att tolka en bild på djupa sätt. Forskare arbetar med det allmänna problemet med datorsyn från olika vinklar, inklusive tredimensionell modellering, igenkänning av delar av en bild och prediktiv bildmodellering.
Ett brett utbud av datorvisionsalgoritmer fungerar på olika sätt. Vissa av dem arbetar för att identifiera specifika delar av ett fotografi eller bild. En del av den här typen av teknik leder till nya ansiktsigenkänningsfunktioner på kameror eller i säkerhetsutrustning.
Andra typer av datorvisionsalgoritmer försöker fånga specifika typer av data från en bild. Många av dessa används nu inom detaljhandeln, där identifiering av mönster från dokument kan vara användbart, till exempel vid analys av tryckta streckkoder och liknande identifierare. Ytterligare andra slags datorvisionsalgoritmer används i tredimensionell rendering och simulering.
Det finns också en helt annan klass av datorvisionsalgoritmer relaterade till fordonsindustrin. Några av dessa tillhandahåller verktyg för det som autoexperter kallar ”augmented reality.” I de nyaste fordonsteknologierna kan datorer hjälpa människor att tolka vägen framåt och undvika faror på vägen eller till och med överhängande kollisioner. Denna teknik förlitar sig ofta på datorvisionsalgoritmer som analyserar den visuella informationen runt fordonet och ger de tolkade resultaten till den mänskliga föraren.
De som studerar algoritmer för datorsyn kan ofta lära av några av de olika typerna av algoritmer som används för olika bilduppgifter. En av dessa är användningen av algoritmer i "morphing", där en bild förvandlas till en annan. En annan typ av algoritm är rekonstruktion med flera vyer. Dessa olika typer av algoritmer utför specifika uppgifter i det som kallas bildbehandling, där människor programmerar teknik för att fånga specifik data och hantera dem på exakta sätt, eller till och med för fysisk reproduktion via 3D-tryckapplikationer.