Hva er 3D Computer Vision?

Tredimensjonal (3D) datamaskinvisjon er en metode for å bruke kameraer som gjør det mulig for datamaskiner å etterligne menneskets syn for å bygge et 3D-bilde. Med 3D-datasyn bruker en datamaskin to kameraer samtidig - akkurat som en person bruker to øyne - for å bygge et bilde med dybde. Bortsett fra bruken av å lage 3D-bilder og filmer med innspillingsenheter, brukes 3D-datasyn også ofte med robotikk, slik at roboter kan fange ekte 3D-miljøer. Et av de største problemene med å utvikle dette systemet var å sikre at kameraene var riktig justert, men mange systemer har perfeksjonert denne teknikken. Denne metoden gjør også 3D-teknologi billigere for forbrukermarkedet, fordi dyre bildeprosessorer ikke er nødvendige for å bygge 3D-bildet.

For at 3D-datasyn skal fungere, trenger datamaskinen å bruke to forskjellige kameraer slik folk bruker to øyne. Begge kameraer tar opp eller fanger opp et miljø fra forskjellige vinkler, slik at datamaskinen kan bruke en algoritme for å blande bildene og danne dybde i virkeligheten. Datamaskiner er også i stand til å ta 3D-bilder i sanntid, uten behov for mye prosessering mellom fangst og 3D-bygning. Dette gjør 3D-datasyn nyttig for spill-, film- og innspillingsmarkedene.

Bortsett fra å bruke 3D-datasyn for å lage bilder og filmer, brukes denne metoden også ofte innen robotikk, spesielt med roboter som er laget for å bevege seg rundt og samhandle med et miljø. Ved å bruke de to kameraene er roboten i stand til å forstå dybden i et miljø, noe som gjør den mer flink til å jobbe med andre objekter og overvinne fysiske hindringer som hull og ujevnheter. Robotbevegelse er også jevnere på grunn av denne dybdeforståelsen.

Det største problemet med å lage 3D-datasyn var å justere de to kameraene slik at de ville fungere som øyne. Mange av de opprinnelige systemene som bruker denne teknologien kunne ikke få kameraene justert, så bilder kom ut uskarpe eller kombinert på usammenhengende måter. Fra 2011 har mange systemer overvunnet dette problemet, og noen er tilgjengelige for forbrukere.

Før 3D-datasyn var det 3D-bildeprosessorer som kunne utføre den samme oppgaven med å ta bilder og kombinere dem til å danne dybde. Hovedproblemet med denne teknikken er at bildeprosessorer er dyre, noe som gjør dem stort sett utilgjengelige for forbrukermarkedet. Kostnader er ikke så mye problem for 3D-datasyn, fordi prosessen med å kombinere bildene er ganske enkel. Dette gjør at forbrukermarkedet kan glede seg over 3D-teknologi uten en stor prislapp.

Hva er 3D Computer Vision?

Hjalp denne artikkelen deg?