Aplicabilidade da Visão Computacional

Já me peguei pensando: “Onde está aquela foto do abajur que tirei na loja de decoração? Ah, vou buscar ‘abajur’ na galeria… e voilà!”. Essa funcionalidade não é tão nova assim. Quem se lembra dos quadrinhos amarelos que identificavam rostos nas antigas câmeras digitais Sony Cybershot? Um toque de nostalgia em algo que já faz parte do nosso dia a dia.. Pois muito bem, neste artigo vamos entender mais dessa tecnologia e aplicabilidades nos dias de hoje e eventuais aplicações no setor elétrico.

Os campos de conhecimento que englobam a inteligência artificial foram amplamente abordados em artigos anteriores da Norven, como no caso do Arquitetura dos Vision Transformers, que se insere no contexto da Visão Computacional. Com base nisso, é pertinente discutir essa área de destaque, especialmente considerando as rápidas evoluções tecnológicas da última década e suas aplicações em diversos setores, incluindo o setor elétrico.

A Visão Computacional é uma área interdisciplinar que se refere ao processamento e à compreensão de dados oriundos de imagens ou vídeos. O termo é apropriado, pois a visão é um sentido que vai além do simples ato de enxergar, requerendo inteligência para a detecção e interpretação do que é observado, seja por um olho ou por uma câmera. Dessa forma, a Visão Computacional abrange o Processamento Digital de Imagens e a Inteligência Artificial na identificação e classificação de estruturas tridimensionais a partir de imagens capturadas por sensores.


Figura 1: revistapesquisa.fapesp.br/as-maquinas-que-tudo-veem

A eficiência das aplicações de Visão Computacional provém da alta velocidade e capacidade automática na análise de imagens, não somente automatizando processos, mas também superando as capacidades humanas. Destaca-se, então, como os algoritmos conseguem identificar uma determinada estrutura e seu respectivo contexto a partir das imagens. Entre as diversas abordagens para detecção de objetos e suas características, algumas metodologias se destacam:

  • Análise por Histograma de Cores

    A análise por histograma de cores é basicamente um gráfico da distribuição dos valores RGB (Vermelho, Verde e Azul) de cada pixel em uma imagem. É possível detectar objetos e suas características em uma imagem colorida através das variações abruptas de cor.


    Figura 2: pyimagesearch.com/2021/04/28/opencv-image-histograms-cv2-calchist
  • Detecção de Bordas

    A detecção de bordas é uma metodologia que utiliza cálculos de blocos de pixels vizinhos e álgebra linear na vetorização e normalização de imagens para identificar as intersecções das estruturas. As bordas permitem definir as margens entre objetos e o plano de fundo da imagem.


    Figura 3: linkedin.com/pulse/segmenta%C3%A7%C3%A3o-baseada-em-bordas-sobel-e-canny
  • Transformada Rápida de Fourier (FFT)

    A FFT (Fast Fourier Transform) é um algoritmo que aplica a transformada de Fourier para decompor uma imagem do domínio espacial para o domínio de frequência. Dessa forma, a FFT de uma imagem auxilia no processamento para outros métodos, tornando-o mais eficiente computacionalmente.


    Figura 4: kaggle.com/code/fanbyprinciple/fast-fourier-transform-for-blur-detection
  • Convolução de Imagens

    A convolução na matemática é um operador linear que resulta, a partir de duas funções, em uma terceira que mede a soma do produto dessas funções ao longo da região subentendida pela superposição delas em função do deslocamento existente. Sua aplicação em imagens é similar, utilizando filtros para segregar objetos e suas características em outras diversas imagens geradas a partir da primeira.


    Figura 5: researchgate.net/figure/Figura-35-Ao-utilizar-convolucao
  • Modelagem Classificatória

    Após definir bem os atributos e características de cada objeto em uma imagem pelas metodologias descritas, utiliza-se a modelagem preditiva de inteligência artificial para classificação. Ou seja, identificam-se semelhanças e diferenças entre os objetos detectados como entrada para classificar cada objeto em seu respectivo rótulo como saída, seja utilizando processos tradicionais de aprendizado de máquina supervisionado ou mesmo arquiteturas de redes neurais profundas, como Vision Transformers ou CNNs (Redes Neurais Convolucionais).


    Figura 6: suzana-svm.medium.com/o-pipeline-de-visao-computacional-com-python-opencv-adc

Aplicabilidade

As amplas aplicações da Visão Computacional geram benefícios em diversas áreas que utilizam dispositivos de captura de imagem, como câmeras comuns, satélites, infravermelhos, ultrassonografias, raio-x, ressonância magnética, telescópios e microscópios, além do nosso bom e velho celular. Ah! Não podemos esquecer das IA Generativas (já abordadas em artigos anteriores).


Figura 7: skynettoday.com/editorials/autonomous_vehicles

No setor elétrico, a visão computacional já é aplicada em imagens de satélites e de drones, para verificação e manutenção do estado das linhas de transmissão, gêmeos digitais para sistemas, detecção de materiais adequados de segurança e diversas outras formas para aperfeiçoamento dos recursos tecnológicos.
Na Norven, estamos estudando outras aplicações como por exemplo: reconhecimento de equipamentos elétricos por imagem, detecção da “saúde” do equipamento e falhas, inspeção de redes aéreas. Como de praxe, estamos sempre nos atualizando nas novas técnicas e ferramentas que aperfeiçoam a capacidade de nossa equipe para abordagens que utilizam inteligência que simplifica e transforma.

Em conclusão, a Visão Computacional representa uma das áreas mais promissoras da Inteligência Artificial, devido à sua capacidade de interpretar dados visuais de maneira eficiente e automatizada. Aliada a algoritmos avançados de aprendizado de máquina, a Visão Computacional tem ampliado suas aplicações em setores diversos, oferecendo soluções que aumentam a eficiência operacional e ultrapassam as limitações da análise visual humana. Esse avanço contínuo evidencia o impacto dessa tecnologia no futuro da automação e da inteligência artificial em geral. Bem-vindos ao futuro!

2023 Copyright | Norven