O que é 3D Computer Vision?
A visão tridimensional (3D) do computador é um método de uso de câmeras que permite aos computadores emular a visão humana para criar uma imagem 3D. Com a visão 3D do computador, um computador usa duas câmeras ao mesmo tempo - assim como uma pessoa usa dois olhos - para criar uma imagem com profundidade. Além de seu uso na criação de imagens e filmes em 3D com dispositivos de gravação, a visão em computador 3D também é usada com frequência em robótica, permitindo que os robôs capturem ambientes 3D reais. Um dos principais problemas no desenvolvimento desse sistema foi garantir o alinhamento correto das câmeras, mas muitos sistemas aperfeiçoaram essa técnica. Esse método também torna a tecnologia 3D mais barata para o mercado consumidor, porque processadores de imagem caros não são necessários para criar a imagem 3D.
Para que a visão 3D do computador funcione, o computador precisa usar duas câmeras diferentes, da mesma forma que as pessoas usam dois olhos. Ambas as câmeras gravam ou capturam um ambiente de diferentes ângulos, permitindo que o computador use um algoritmo para misturar as imagens e formar profundidade na vida real. Os computadores também são capazes de capturar imagens 3D em tempo real, sem a necessidade de muito processamento entre a captura e a construção 3D. Isso torna a visão em computador 3D útil para os mercados de jogos, filmes e gravação.
Além de usar a visão computacional em 3D para criar imagens e filmes, esse método também é frequentemente usado em robótica, especialmente em robôs feitos para se movimentar e interagir com um ambiente. Ao usar as duas câmeras, o robô é capaz de entender a profundidade de um ambiente, tornando-o mais apto a trabalhar com outros objetos e a superar obstáculos físicos, como lacunas e inchaços. O movimento robótico também é mais suave por causa dessa compreensão de profundidade.
O principal problema na criação da visão em computador 3D era alinhar as duas câmeras para que funcionassem como olhos. Muitos dos sistemas iniciais que usam essa tecnologia não conseguiram alinhar as câmeras, de modo que as imagens saíram borradas ou combinadas de maneiras incoerentes. A partir de 2011, muitos sistemas superaram esse problema e alguns estão disponíveis para os consumidores.
Antes da visão em computador 3D, havia processadores de imagem 3D que podiam executar a mesma tarefa de capturar imagens e combiná-las para formar profundidade. O principal problema dessa técnica é que os processadores de imagem são caros, tornando-os inacessíveis para o mercado consumidor. O custo não é tão problemático para a visão em computador 3D, porque o processo de combinar as imagens é bastante simples. Isso permite que o mercado consumidor desfrute da tecnologia 3D sem um grande preço.