A Toshiba Corporation desenvolveu um AI com reconhecimento 3D que é capaz de medir distâncias com a precisão de uma câmera estéreo, usando a imagem tirada com uma câmera comercial e analisando o borrão da imagem causado pela lente da câmera usando aprendizado profundo. Essa tecnologia eliminará o uso de câmeras estéreo, o que acaba reduzindo o custo e o espaço. A Toshiba apresentará essa conquista na conferência internacional sobre visão computacional (ICCV2019) a ser realizada na Coréia do Sul em 30 de outubro de 2019, a partir das 10h.
O sensor de imagem está se tornando mais importante e aplicativos como robôs em movimento, veículos autônomos não tripulados, drones controlados remotamente que inspecionam infraestrutura, etc., exigem mais do que apenas imagens dos sujeitos, eles precisam de um pequeno dispositivo para analisar dados 3D para incluir forma e distância. Portanto, as pesquisas têm aumentado para desenvolver uma tecnologia de medição com câmeras monoculares (são fáceis de miniaturizar) usando o aprendizado profundo para um melhor aprendizado da forma, do plano de fundo e de outros dados do cenário do objeto imageado.
Este método tem uma desvantagem; a precisão da distância é estimada com a ajuda de uma câmera monocular dependendo dos dados de cenário aprendidos, o que causa uma queda na precisão devido às fotos tiradas em diferentes paisagens. Para superar isso, a Toshiba desenvolveu a fotografia de abertura com filtro de cor na qual dois filtros de cor são colocados na lente e a cor e o tamanho do borrão da imagem resultante são analisados de acordo com a distância do assunto. Embora isso resolva o problema de dependência de dados, custa tempo e dinheiro para modificar as lentes existentes.
A Toshiba superou esse problema desenvolvendo IA com tecnologia de reconhecimento 3D que usa aprendizado profundo para analisar como a imagem está borrada de acordo com sua posição na lente, a fim de obter medição de distância com a mesma alta precisão de um sistema de câmera estéreo, com uma câmera monocular normal, mas sem qualquer necessidade de dados de cenário. Até agora, era considerado teoricamente impossível medir a distância com base na forma do desfoque, que é o mesmo para objetos tanto à distância quanto à distância quando estão equidistantes do ponto focal. Mas, os resultados analíticos mostraram uma diferença substancial entre as formas de desfoque de objetos próximos e distantes, mesmo que sejam equidistantes do ponto focal. Com isso, a Toshiba analisou com sucesso os dados borrados de imagens capturadas por um módulo de aprendizado profundo treinado com o modelo de rede neural profunda.
Quando a luz passa através da lente, sabe-se que a forma do desfoque criado muda dependendo do comprimento de onda da luz e sua posição na lente. Na rede desenvolvida, a posição e a cor são processadas separadamente para perceber adequadamente as mudanças na forma do borrão e, em seguida, após passar por um mecanismo de atenção ponderada, para controlar onde no gradiente de brilho focar para medir corretamente a distância. Por meio do aprendizado, a rede é então atualizada para reduzir um erro entre a distância medida e a distância real. Usando este módulo AI, a Toshiba confirmou que uma única imagem capturada com uma câmera disponível comercialmente obtém a mesma precisão de medição de distância obtida com câmeras estéreo. Mais informações podem ser encontradas nesta página oficial da Toshiba.
A Toshiba vai confirmar a versatilidade do sistema com câmeras e lentes disponíveis no mercado e agilizar o processamento de imagens, com vistas à implementação pública no ano fiscal de 2020.