Hva er datavisjonsalgoritmer?
Datasynsalgoritmer er matematiske modeller som prøver å hjelpe en datamaskin til å tolke et bilde. Mennesker tolker bilder på mange komplekse måter, der datamaskinens faktiske evne til å tolke bilder er ekstremt begrenset, selv med den nyeste teknologien. Datasynsalgoritmer er også med på å gjøre fremskritt på måtene datamaskiner kan få spesifikke typer data fra et bilde.
Utfordringene for ingeniører som bruker datamaskinvisjonsalgoritmer er at visjonen er avhengig av en rekke deduksjoner relatert til ukjente elementer i bildet. Forskere kaller dette for et "omvendt problem", og sier at bare komplekse fysikkbaserte sannsynlighetsmodeller kan hjelpe teknologien til å tolke et bilde på dyptgripende måter. Forskere arbeider med det generelle problemet med datasyn fra forskjellige vinkler, inkludert tredimensjonal modellering, gjenkjennelse av deler av et bilde og prediktiv bildemodellering.
Et bredt spekter av datamaskinvisjonsalgoritmer fungerer på forskjellige måter. Noen av dem jobber for å identifisere bestemte deler av et fotografi eller bilde. Noe av denne typen teknologi fører til nye ansiktsgjenkjenningsfunksjoner på kameraer eller i sikkerhetsutstyr.
Andre typer datamaskinvisjonsalgoritmer prøver å fange bestemte typer data fra et bilde. Mange av disse brukes nå i detaljhandelsfeltet, der det kan være nyttig å identifisere mønstre fra dokumenter, for eksempel i analysen av trykte strekkoder og lignende identifikatorer. Fortsatt andre slags datamaskinvisjonsalgoritmer brukes i tredimensjonal gjengivelse og simuleringer.
Det er også en helt annen klasse av datasyn-algoritmer relatert til bilindustrien. Noen av disse gir verktøy for det som autoeksperter omtaler som "augmented reality." I de nyeste kjøretøyteknologiene kan datamaskiner hjelpe mennesker til å tolke veien videre og unngå veifar eller til og med forestående kollisjoner. Disse teknologiene er ofte avhengige av datamaskinens visjonsalgoritmer som analyserer de visuelle dataene rundt kjøretøyet, og gir de tolke resultatene til den menneskelige sjåføren.
De som studerer algoritmer for datasyn kan ofte lære av noen av de forskjellige typer algoritmer som brukes til forskjellige bildeoppgaver. En av disse er bruken av algoritmer i "morfing", der det ene bildet blir til et annet. En annen type algoritme er rekonstruksjon i flere visninger. Disse forskjellige algoritmene utfører bestemte oppgaver i det som kalles bildebehandling, der mennesker programmerer teknologier for å fange opp spesifikke data og håndtere det på presise måter, eller til og med for fysisk reproduksjon via 3D-utskriftsapplikasjoner.