Fundamentos de Imagens Digitais

Visão Computacional

Pontifícia Universidade Católica de Campinas

Prof. Dr. Denis M. L. Martins

Objetivos de Aprendizado

  • Definir o que é processamento digital de imagens.
  • Compreender os fundamentos matemáticos da imagem digital: função bidimensional, amostragem e quantização.
  • Explicar a representação digital de imagens em escala cinza e coloridas.

O que é Processamento Digital de Imagens (PDI)?

  • Transformação de sinais ópticos em dados digitais para análise, interpretação e manipulação.
  • Envolve aquisição, pré‑processamento, segmentação, reconhecimento e pós‑processamento de imagens.
  • Fundamenta aplicações em diagnóstico médico, controle industrial, multimídia e sistemas autônomos.

Processos Computacionais com Imagens

Computação Gráfica
(CG)
Visão Computacional
(VC)
Processamento Digital de Imagens
(PDI)
Cria e altera imagens a partir de dados. Análise de imagem para criação de modelos. Transformação de imagem (tratamento)
modelo → imagem imagem → modelo imagem → imagem

Retirado de https://covap-utfpr.github.io/pdi/intro.html#intro

Elementos da percepção visual

  • Fótons são convertidos em sinais elétricos por fotopigmentos.
  • Conexão axonal via nervo óptico até o cérebro (córtex visual).
  • Sistema tricomático: cones L (vermelho), M (verde) e S (azul).
  • Cores são interpretadas como combinações de respostas desses três tipos.
  • Resolução espacial limitada pelo tamanho do pixel ocular (~1 µm).
  • Atenção seletiva: apenas uma fração das informações visuais é processada conscientemente.

Fonte da imagem: Pinterest

Espectro Eletromagnético

center

Fonte: Imagem da Wikipedia

Podemos entender imagens como funções

Fundamentos da imagem digital

Imagem como função

Fundamentos da imagem digital

  • Imagem: Função bidimensional que descreve a intensidade de cada ponto no plano.
  • Em tons de cinza (grayscale) de 8 bits, temos:
  • Matrix , onde e é o número de bits por pixel.

center
Representação de pixels de uma imagem. Fonte: OpenFrameworks - Image Processing.

Imagem colorida

  • Uma versão estendida de uma imagem em tons de cinza.
  • Em Red, Green, and Blue (RGB): cada pixel da imagem tem 3 canais.
  • como um vetor de 3 valores, ao invés de 1.
    • Em 8 bits, temos cada pixel variando entre 0 e 255 em cada canal.
    • Um total de combinações.


Fonte da Imagem: Computer Vision @Stanford

Resolução espacial

  • Densidade de pixels: pixels por unidade de distância, dots per inch (pontos por polegada ou dpi).
  • Abaixo, podemos notar os efeitos da resolução na imagem.
    center

Fonte da Imagem: https://covap-utfpr.github.io/pdi/formacaoImagem.html#formacaoImg.

Resolução espacial

:
Resolução espacial em imagens aéreas. Fonte: Landsat

Aquisição de Imagem

  • Sensores CCD / CMOS: convertam fótons em carga elétrica ou corrente direta.
  • Exposição (tempo de captura).
  • Conversão analógica‑digital (ADC).
  • Formato bruto: dados RAW antes de qualquer correção ou compressão.

Exemplo de um sistema de aquisição de imagem. Fonte: Digital Image Processing Book @ResearchGate

Amostragem

  • Conversão de espaço contínuo para espaço discreto.
    • Sequência infinita de números reais
    • Representação digital finita (pense em armazenamento na memória)
  • Amostragem pelo sensor de captura: representação de parte do sinal.
  • Quantização: capturar pontos do sinal (ainda mantendo sua estrutura)

Exemplo de um sistema de aquisição de imagem. Fonte: Digital Image Processing Book @ResearchGate

Quantização

Resultado da amostragem e quantização da imagem. Fonte: Digital Image Processing Book @ResearchGate

Exemplos de áreas que utilizam o PDI

Área Aplicações típicas
Medicina Radiologia (CT, MRI), microscopia celular, análise histológica
Segurança Reconhecimento facial, vigilância por vídeo, inspeção de bagagens
Indústria Controle de qualidade em linhas de montagem, inspeção visual de componentes
Satélite / Aeronáutica Análise de imagens de satélite, mapeamento topográfico
Entretenimento Efeitos visuais, renderização 3D, realidade aumentada
Agricultura Monitoramento de culturas via UAVs, detecção de pragas

Saúde e Medicina

Fonte: https://radiology.medicine.arizona.edu/research/image-processing

Formato de imagens digitais

  • Formato Bruto (RAW)
    • Dados sem processamento; contém todas as informações capturadas pelo sensor.
    • Requer pipeline de correção: remoção de cor, gamma, white‑balance e compressão.
  • Formatos Sem Perda
    • TIFF: Imagens de alta qualidade (eletrônica médica, impressão). Compressão LZW/ZIP.
    • PNG: Web, gráficos vetoriais; preserva transparência. Compressão Deflate.
  • Formato com Perda:
    • JPEG. Usado em fotografia digital, web. Compressão DCT‑based.
  • Formato Profissional
    • DICOM: padrão para imagens médicas (raios X, tomografia).
    • JPEG‑2000: compressão wavelet, usada em radiologia e satélite.
  • Considerações Práticas
    • Canais de Cor: RGB, CMYK, YCbCr, HSV – escolha depende da aplicação final.
    • Metadados: Exif, IPTC e XMP armazenam informações sobre câmera, localidade, direitos autorais.

Conclusão

  • Processamento digital de imagens é essencial em diversas áreas: medicina, manutenção preventiva, astronomia, fotografia, cinema, etc.
  • Imagem como função discreta: representa intensidades pixel‑por‑pixel.
  • Perspectiva futura: os conceitos aqui apresentados fundamentam técnicas avançadas de filtragem, transformação e análise que serão exploradas nas próximas aulas.

center

Atividade recomendada: Leitura dos capítulos 1 e 2.

# Relacionamentos básicos entre pixels | Propriedade | Definição | |-------------|-----------| | **Vizinho imediato** | 4‑neighborhood (N, S, E, W) ou 8‑neighborhood (inclui diagonais). | | **Distância Euclidiana** | $d(p,q)=\sqrt{(x_p-x_q)^2+(y_p-y_q)^2}$ | | **Similaridade de intensidade** | $\vert I(p)-I(q) \vert < T$ (threshold). | | **Conectividade** | Pixels conectados se pertencem ao mesmo componente conexa. | --- Para ilustrar a diferença entre *conectividade 4* e *8*, considere o padrão de pixels abaixo: ``` 1 0 1 0 1 0 1 0 1 ``` - Sob conectividade 4, os pixels “1” são isolados. - Sob conectividade 8, todos os “1” pertencem a um único componente. ---