Qu'est-ce que la vision par ordinateur 3D?
La vision par ordinateur en trois dimensions (3D) est une méthode d'utilisation de caméras qui permet aux ordinateurs d'émuler la vision humaine pour créer une image 3D. Avec la vision par ordinateur 3D, un ordinateur utilise deux caméras à la fois, tout comme une personne utilise deux yeux, pour construire une image avec profondeur. Outre son utilisation dans la création d'images et de films 3D avec des appareils d'enregistrement, la vision par ordinateur en 3D est également utilisée fréquemment avec la robotique, permettant aux robots de capturer de véritables environnements 3D. L'un des problèmes majeurs du développement de ce système était de s'assurer que les caméras étaient correctement alignées, mais de nombreux systèmes ont perfectionné cette technique. Cette méthode rend également la technologie 3D moins chère pour le marché grand public, car il n’est pas nécessaire de recourir à des processeurs d’image coûteux pour créer l’image 3D.
Pour que la vision par ordinateur en 3D fonctionne, l'ordinateur doit utiliser deux caméras différentes, de la même manière que les utilisateurs utilisent deux yeux. Les deux caméras enregistrent ou capturent un environnement sous différents angles, ce qui permet à l'ordinateur d'utiliser un algorithme pour fusionner les images et créer une profondeur réelle. Les ordinateurs sont également capables de capturer des images 3D en temps réel, sans nécessiter beaucoup de traitement entre la capture et la création 3D. Cela rend la vision par ordinateur 3D utile pour les marchés du jeu, du film et de l'enregistrement.
Outre l'utilisation de la vision par ordinateur en 3D pour créer des images et des films, cette méthode est également souvent utilisée en robotique, notamment avec des robots conçus pour se déplacer et interagir avec un environnement. En utilisant les deux caméras, le robot est capable de comprendre la profondeur d'un environnement, ce qui le rend plus apte à travailler avec d'autres objets et à surmonter les obstacles physiques tels que les trous et les bosses. Le mouvement robotique est également plus fluide grâce à cette compréhension de la profondeur.
Le principal problème rencontré lors de la création d’une vision par ordinateur en 3D était l’alignement des deux caméras afin qu’elles fonctionnent comme des yeux. La plupart des systèmes initiaux utilisant cette technologie ne pouvaient pas aligner les caméras. Les images sont donc floues ou combinées de manière incohérente. Depuis 2011, de nombreux systèmes ont résolu ce problème et certains sont disponibles pour les consommateurs.
Avant la vision par ordinateur en 3D, certains processeurs d'images 3D pouvaient effectuer la même tâche, à savoir prendre des images et les combiner pour obtenir de la profondeur. Le principal problème de cette technique est que les processeurs d’image sont coûteux, ce qui les rend en grande partie inaccessibles au marché grand public. Le coût n'est pas un problème pour la vision par ordinateur en 3D, car le processus de combinaison des images est plutôt simple. Cela permet au marché grand public de profiter de la technologie 3D sans un prix trop élevé.