top-right

Visão Computacional

Organização e Visão Geral

Pontifícia Universidade Católica de Campinas

Prof. Dr. Denis M. L. Martins

Motivação e Aplicações

Problemas Complexos

center

Fonte da Imagem: Shunmugaraj @LinkedIn

Land cover maps

center

Fonte da Imagem: Kate Fickas, Vinay Viswambharan, and Priyanka Tuteja @ArcGIS Blog

Point Cloud Data

center

Fonte da Imagem: Tom Staelens @Segments.ai. Veja também: Generation of a 3D point Cloud YouTube

Super-Resolution

center

Fonte da Imagem: Rohit Kundu @v7Labs

Object Detection

center

Fonte da Imagem: Patrick @GoogleColab. Veja também: Yolo Object Detection YouTube

Visão Geral e Organização

Objetivo da Disciplina

  • Objetivo Teórico: Compreender as técnicas computacionais, os desafios e as aplicações de aprendizado de máquina para o processamento e análise de imagens.

  • Objetivo Prático: Criar modelos computacionais que sejam capazes de entender o conteúdo visual em imagens.

Ementa e Escopo

  • Aquisição e Pré-processamento de Imagens: Como capturamos, representamos e preparamos imagens para análise.
  • Extração de Características: Identificação de padrões relevantes nas imagens.
  • Reconhecimento de Objetos/Padrões: Classificar e identificar objetos dentro da imagem.
  • Segmentação: Dividir a imagem em regiões significativas.

Organização da Disciplina

  • Aulas Teóricas: Apresentação de conceitos fundamentais, operações e modelos.
  • Práticas: Desenvolvimento de código e realização de atividades.
  • Material de aula
    • Slides
    • Jupyter Notebook/Google Colab
  • Ferramentas
    • Python e PyTorch
    • GitHub
  • Atividades Práticas: Submissão de código e documentação.
  • Trabalho Final: Projeto de implementação realizado em grupo.
    • Temas e grupos serão definidos mais tarde

Avaliação

  • Prova: 03/11/2025 Multipla Escolha (estilo ENADE) e Discursivas/Resolução de Problemas.
  • Cálculo da Média:
    • Média Teórica (MT): Nota da Prova
    • Média Prática (MP): 0,4 Atividades Práticas + 0,6 Trabalho Final
    • Se MT e MP 5,0 então:
      • Média Final (MF) = 0,4 MT + 0,6 MP.
    • Se MT e/ou MP 5,0 então:
      • MF = min(MT, MP)
  • Prova de Recuperação: 03/12/2025
    • Apenas para alunos com MT 5,0.
    • Todo o conteúdo da disciplina.
    • Substitui MT. Ainda assim, MF = min(MT, MP).

Bibliografia Básica

  • Gonzalez, Rafael C., and Richard C. Woods. Processamento digital de imagens. 3.ed. São Paulo, SP: Pearson, 2010.
  • Goodfellow, Ian, et al. Deep learning. Vol. 1. No. 2. Cambridge: MIT press, 2016: https://www.deeplearningbook.org/
  • COPPIN, Ben. Inteligência artificial. Rio de Janeiro, RJ: GEN LTC, 2010.
  • RUSSEL, S. J., NORVIG, P. Inteligência Artificial: Uma Abordagem Moderna. GEN LTC. 4a. Edição, 2022.

Bibliografia Complementar

Contexto da Disciplina

Trabalhabilidade > Empregabilidade

"In the next five years, 170 million jobs are projected to be created and 92 million jobs to be displaced (...)." - The Future of Jobs - Report 2025, WEF.

Como se preparar para posições de trabalho que ainda não existem?

Contexto da Disciplina (cont.)

"Hiring new people with skills to design AI tools and enhancements appropriate for the organization-specific skills" - The Future of Jobs - Report 2025, WEF.

Conceitos iniciais

center
Fonte da Imagem: Admscentre. Veja também: History of AI.

Pipeline Geral de ML

  • Boa parte do tempo gasto no tratamento de dados
    • Feature Extraction
    • Feature Engineering
  • Processo bastante iterativo (voltar para etapa anterior e corrigir algo)
  • Fonte da imagem à esquerda: Data Professor @GitHub
    center
  • Fonte da imagem acima: AIT Goehner GmbH

center

Fonte da Imagem: Brian Wang @NextBigFuture

center

Fonte da Imagem: Amit Kumar.

A vida de um modelo de ML é difícil


Fonte das imagens: Bored Panda

Dúvidas e Discussão

# Grande Impacto em Diversos Setores * **Carros Autônomos:** Detecção de pedestres, placas, outros veículos. * **Medicina Diagnóstica:** Análise de imagens médicas. * **Segurança & Vigilância:** Reconhecimento facial, detecção de anomalias. * **Agricultura:** Monitoramento da saúde das plantações. * **Realidade Aumentada/Virtual:** Rastreamento do ambiente.

---