O que é a Computer Vision Robotics?
Um tipo de inteligência artificial, a robótica de visão computacional equipa dispositivos eletrônicos ou mecânicos com visão com o objetivo de realizar uma tarefa específica. A tecnologia combina hardware e software que captura imagens, interpreta os dados e executa uma resposta programada. A tecnologia de visão computacional pode envolver nada além de uma câmera de vídeo conectada a um computador que contém software interpretativo. Formas mais elaboradas de visão computacional podem incluir uma rede de lasers infravermelhos e receptores de sensores que transmitem informações ao software analítico. Os aplicativos de visão computacional comumente usados incluem inspeção industrial, imagens médicas e vigilância.
O software necessário geralmente contém algoritmos de visão computacional, geralmente originários da Open Source Computer Vision Library ou Open CV. A biblioteca é um banco de dados gratuito desenvolvido pela Intel Corporation para designers de software. Usando esses algoritmos, os programadores criam software que aprende o reconhecimento de objetos, recebe dados visuais e geralmente inicia uma resposta mecânica. O software pode converter as informações em imagens ou gravar informações de uma área específica.
A robótica para visão computacional usada por fabricantes industriais geralmente inclui câmeras de vídeo de alta velocidade ou raios laser, além de sensores que podem detectar produtos que viajam pela correia transportadora. Essas informações são transmitidas para um sistema computadorizado que conta os itens ou inspeciona a qualidade do produto acabado. Se ocorrer um erro, o software poderá responder acionando um alarme. As empresas costumam usar o reconhecimento de imagem combinado com a interação mecânica para classificação e embalagem.
A conversão de imagens bidimensionais em imagens tridimensionais requer robótica de visão computacional. As câmeras posicionadas em torno de um objeto ou local capturam imagens de diferentes ângulos. O software então compila essas imagens e renderiza uma representação multidimensional. Da mesma forma, a tecnologia computadorizada converte os sinais de energia emitidos pelos dispositivos de imagem médica em imagens multidimensionais que exibem as estruturas internas do corpo humano.
Os sistemas de vigilância por vídeo combinam câmeras de vídeo, monitorando um território específico, com um software de robótica para visão computacional, capaz de analisar o rastreamento de movimento em tempo real. O software inicialmente aprende a diferença entre objetos em movimento e objetos estacionários. O programa então diferencia entre movimento humano e movimento não humano. Finalmente, os programas distinguem entre padrões normais e anormais de caminhada ou movimento peculiar dos membros.
Os sistemas modernos de jogos incorporam robótica de visão computacional que reconhece o movimento humano e traduz as informações em movimentos executados por figuras animadas na tela. A tecnologia Kinect® consiste em um dispositivo que emite uma grade de laser infravermelho no campo de jogo. Os sensores de movimento contidos no dispositivo detectam feixes refletidos de volta para a unidade. O software interpreta esses sinais em tempo real e em padrões tridimensionais. O programa transfere esses movimentos para representações humanas na tela.