Qu'est-ce que la coque visuelle?
En imagerie informatique, une coque visuelle est la forme tridimensionnelle (3D) d'un objet qui est extrapolée à partir de plusieurs images bidimensionnelles (2D) prises à différents angles autour de l'objet approximé. Les données de surface relatives à la forme d'un objet sont obtenues en traçant le contour d'un objet dans une image, créant essentiellement une silhouette de l'objet sans texture ni détail interne spécifique. Une collection de silhouettes, toutes extraites d’images prises à des angles différents, est assemblée dans un espace 3D et la zone située entre les points de contour connus est interpolée pour former un objet 3D présentant le contour général en 3D de l’objet même, sans peut-être autant détail spécifique. Le processus utilisé pour créer une coque visuelle, également appelé forme à partir d'une silhouette (SFS), peut être plus rapide, moins gourmand en ressources processeur et moins onéreux à mettre en œuvre que certaines techniques stéréoscopiques de capture de mouvement 3D ou de détection de la forme d'objets 3D. Parmi les applications qui utilisent la coque visuelle, on peut citer la détection d’obstacles par vision par ordinateur, la capture de mouvement à des fins médicales ou autres fins d’analyse, ainsi que la numérisation d’objets 3D virtuels lorsque la SFS est réalisée dans des conditions hautement contrôlées.
Le processus de formation de la coque visuelle d'un objet à partir d'un ensemble d'images consiste à isoler la silhouette de l'objet du fond des images. L'emplacement exact et l'orientation des caméras utilisées pour acquérir les images sont également importants pour le processus. Dans chaque image, un chemin rectiligne est tracé à partir du plan de visualisation de l'image vers l'espace de la scène et se termine sur les contours de l'objet en cours d'imagerie. Cette opération est effectuée pour chaque image et la zone où se croisent chacun des chemins, qui ressemblent à des cônes dans un environnement 3D, donne un volume très grossier, semblable à un bloc, qui contient l'objet dans les dimensions de la scène. Pour certaines applications, telles que la vision par ordinateur, ces informations suffisent à éviter les obstacles de base.
Les silhouettes peuvent être encore affinées pour que les détails géométriques plus petits soient traduits dans la coque visuelle. Celles-ci peuvent inclure des trous dans l’objet, ce qui pourrait se produire si la coque visuelle était construite à partir d’images représentant un être humain debout, les jambes écartées ou les bras écartés. Un attribut d'une forme d'objet qui ne peut pas être capturé avec précision avec les techniques SFS est une surface concave, car elle ne contribue pas à la silhouette.
La technique SFS de création de la coque visuelle d'un objet peut être incroyablement détaillée et précise si des algorithmes raffinés sont utilisés conjointement avec des conditions contrôlées pour créer les images source. Ces conditions peuvent inclure une seule source de lumière cohérente, un arrière-plan statique et mesurable et des caméras parfaitement calibrées. Dans ces conditions, des modèles 3D d'objets très précis peuvent être construits et la capture de mouvement peut être effectuée sans recourir à des repères, des traceurs ou un équipement spécial au-delà des caméras.