O que é o casco visual?
Em imagens de computador, um casco visual é a forma tridimensional (3D) de um objeto que é extrapolada de várias imagens bidimensionais (2D) tiradas em ângulos diferentes ao redor do objeto que está sendo aproximado. Os dados de superfície sobre a forma de um objeto são obtidos traçando o contorno de um objeto em uma imagem, criando essencialmente uma silhueta do objeto sem textura ou detalhes internos específicos. Uma coleção de silhuetas, todas extraídas de imagens tiradas em ângulos diferentes, é montada no espaço 3D e a área entre os pontos de contorno conhecidos é interpolada para formar um objeto 3D que possui o contorno 3D geral do objeto real, embora talvez sem tanto detalhe específico. O processo usado para criar um casco visual, também conhecido como formato de silhueta (SFS), pode ser mais rápido, menos intensivo em processador e mais barato de implementar do que algumas técnicas estereoscópicas para capturar movimento 3D ou detectar a forma de objetos 3D. Algumas das aplicações que usam o casco visual incluem detecção de obstáculos por visão computacional, captura de movimento para fins médicos ou outros fins analíticos e varredura virtual de objetos 3D quando o SFS é realizado em condições altamente controladas.
O processo de formação do casco visual de um objeto a partir de um conjunto de imagens envolve isolar a silhueta do objeto do fundo nas imagens. A localização exata e a orientação das câmeras usadas para adquirir as imagens também são importantes para o processo. Em cada imagem, é feito um caminho reto desde o plano de visualização da imagem até o espaço da cena e terminando nos contornos do objeto que está sendo fotografado. Isso é feito para cada imagem e a área em que cada um dos caminhos, que se assemelham aos cones em um ambiente 3D, cruza, fornece um volume muito áspero, em forma de bloco, que contém o objeto dentro das dimensões da cena. Para algumas aplicações, como visão computacional, essas informações são suficientes para permitir a prevenção básica de obstáculos.
As silhuetas podem ser refinadas ainda mais, para que detalhes geométricos menores sejam traduzidos para o casco visual. Isso pode incluir buracos no objeto, como pode ocorrer se o casco visual estiver sendo construído a partir de imagens de um humano em pé com as pernas afastadas ou os braços estendidos. Um atributo de uma forma de objeto que não pode ser capturada com precisão com técnicas de SFS é uma superfície côncava, porque não contribui para a silhueta.
A técnica SFS para criar o casco visual de um objeto pode ser incrivelmente detalhada e precisa se algoritmos refinados forem usados em conjunto com condições controladas para criar as imagens de origem. Essas condições podem incluir uma fonte de luz única e consistente, um fundo estático e mensurável e câmeras que são calibradas com precisão. Dadas essas condições, modelos 3D de objetos muito precisos podem ser construídos e a captura de movimento pode ser realizada sem a necessidade de marcadores, rastreadores ou equipamento especial além das câmeras.