Filtragem Espacial#
Visão Computacional | Prof. Dr. Denis Mayr Lima Martins
Entendendo Convolução#
“Convolução é um operador linear que, a partir de duas funções dadas, resulta numa terceira que mede a soma do produto dessas funções ao longo da região subentendida pela superposição delas em função do deslocamento existente entre elas.” - Wikipedia.
Caso 1D: https://antoinebrl.github.io/blog/conv1d/#


Caso 2D: https://objetos.github.io/docs/demos/image_conv_vis/#
Kernel: matriz de pesos \((w_{mn})\).
\(g(x,y) = w(x,y)*f(x,y) = \sum_{s=-a}^{a}\sum_{t=-b}^{b} w(s,t)f(x-s,y-t)\)
Coloque o centro do kernel sobre o pixel que você está analisando.
Multiplique cada elemento do kernel pelo valor do pixel correspondente na imagem (a região coberta).
Some todos esses produtos para obter um único número, que se torna o novo valor desse pixel na saída.
Assim, a convolução é simplesmente “deslizar um pequeno molde de números sobre a imagem e calcular uma soma ponderada” em cada posição, produzindo efeitos variados dependendo do padrão escolhido para o kernel.
Propriedades da Convolução#
Comutatividade
Associatividade
Distributividade
Associatividade com multiplicação escalar
Imports e Preparação#
import cv2
import numpy as np
import matplotlib.pyplot as plt
from urllib.request import urlopen
SEED = 1234
np.random.seed(SEED)
A module that was compiled using NumPy 1.x cannot be run in
NumPy 2.2.5 as it may crash. To support both 1.x and 2.x
versions of NumPy, modules must be compiled with NumPy 2.0.
Some module may need to rebuild instead e.g. with 'pybind11>=2.12'.
If you are a user of the module, the easiest solution will be to
downgrade to 'numpy<2' or try to upgrade the affected module.
We expect that some modules will need time to support NumPy 2.
Traceback (most recent call last): File "<frozen runpy>", line 198, in _run_module_as_main
File "<frozen runpy>", line 88, in _run_code
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel_launcher.py", line 17, in <module>
app.launch_new_instance()
File "/opt/anaconda3/lib/python3.11/site-packages/traitlets/config/application.py", line 992, in launch_instance
app.start()
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/kernelapp.py", line 701, in start
self.io_loop.start()
File "/opt/anaconda3/lib/python3.11/site-packages/tornado/platform/asyncio.py", line 195, in start
self.asyncio_loop.run_forever()
File "/opt/anaconda3/lib/python3.11/asyncio/base_events.py", line 607, in run_forever
self._run_once()
File "/opt/anaconda3/lib/python3.11/asyncio/base_events.py", line 1922, in _run_once
handle._run()
File "/opt/anaconda3/lib/python3.11/asyncio/events.py", line 80, in _run
self._context.run(self._callback, *self._args)
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/kernelbase.py", line 534, in dispatch_queue
await self.process_one()
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/kernelbase.py", line 523, in process_one
await dispatch(*args)
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/kernelbase.py", line 429, in dispatch_shell
await result
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/kernelbase.py", line 767, in execute_request
reply_content = await reply_content
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/ipkernel.py", line 429, in do_execute
res = shell.run_cell(
File "/opt/anaconda3/lib/python3.11/site-packages/ipykernel/zmqshell.py", line 549, in run_cell
return super().run_cell(*args, **kwargs)
File "/opt/anaconda3/lib/python3.11/site-packages/IPython/core/interactiveshell.py", line 3051, in run_cell
result = self._run_cell(
File "/opt/anaconda3/lib/python3.11/site-packages/IPython/core/interactiveshell.py", line 3106, in _run_cell
result = runner(coro)
File "/opt/anaconda3/lib/python3.11/site-packages/IPython/core/async_helpers.py", line 129, in _pseudo_sync_runner
coro.send(None)
File "/opt/anaconda3/lib/python3.11/site-packages/IPython/core/interactiveshell.py", line 3311, in run_cell_async
has_raised = await self.run_ast_nodes(code_ast.body, cell_name,
File "/opt/anaconda3/lib/python3.11/site-packages/IPython/core/interactiveshell.py", line 3493, in run_ast_nodes
if await self.run_code(code, result, async_=asy):
File "/opt/anaconda3/lib/python3.11/site-packages/IPython/core/interactiveshell.py", line 3553, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
File "/var/folders/p7/p37cm2fj10xgjrjj5rzdm66c0000gn/T/ipykernel_59184/488522286.py", line 3, in <module>
import matplotlib.pyplot as plt
File "/opt/anaconda3/lib/python3.11/site-packages/matplotlib/__init__.py", line 161, in <module>
from . import _api, _version, cbook, _docstring, rcsetup
File "/opt/anaconda3/lib/python3.11/site-packages/matplotlib/rcsetup.py", line 27, in <module>
from matplotlib.colors import Colormap, is_color_like
File "/opt/anaconda3/lib/python3.11/site-packages/matplotlib/colors.py", line 57, in <module>
from matplotlib import _api, _cm, cbook, scale
File "/opt/anaconda3/lib/python3.11/site-packages/matplotlib/scale.py", line 22, in <module>
from matplotlib.ticker import (
File "/opt/anaconda3/lib/python3.11/site-packages/matplotlib/ticker.py", line 143, in <module>
from matplotlib import transforms as mtransforms
File "/opt/anaconda3/lib/python3.11/site-packages/matplotlib/transforms.py", line 49, in <module>
from matplotlib._path import (
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
AttributeError: _ARRAY_API not found
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
Cell In[1], line 3
1 import cv2
2 import numpy as np
----> 3 import matplotlib.pyplot as plt
4 from urllib.request import urlopen
6 SEED = 1234
File /opt/anaconda3/lib/python3.11/site-packages/matplotlib/__init__.py:161
157 from packaging.version import parse as parse_version
159 # cbook must import matplotlib only within function
160 # definitions, so it is safe to import from it here.
--> 161 from . import _api, _version, cbook, _docstring, rcsetup
162 from matplotlib.cbook import sanitize_sequence
163 from matplotlib._api import MatplotlibDeprecationWarning
File /opt/anaconda3/lib/python3.11/site-packages/matplotlib/rcsetup.py:27
25 from matplotlib import _api, cbook
26 from matplotlib.cbook import ls_mapper
---> 27 from matplotlib.colors import Colormap, is_color_like
28 from matplotlib._fontconfig_pattern import parse_fontconfig_pattern
29 from matplotlib._enums import JoinStyle, CapStyle
File /opt/anaconda3/lib/python3.11/site-packages/matplotlib/colors.py:57
55 import matplotlib as mpl
56 import numpy as np
---> 57 from matplotlib import _api, _cm, cbook, scale
58 from ._color_data import BASE_COLORS, TABLEAU_COLORS, CSS4_COLORS, XKCD_COLORS
61 class _ColorMapping(dict):
File /opt/anaconda3/lib/python3.11/site-packages/matplotlib/scale.py:22
20 import matplotlib as mpl
21 from matplotlib import _api, _docstring
---> 22 from matplotlib.ticker import (
23 NullFormatter, ScalarFormatter, LogFormatterSciNotation, LogitFormatter,
24 NullLocator, LogLocator, AutoLocator, AutoMinorLocator,
25 SymmetricalLogLocator, AsinhLocator, LogitLocator)
26 from matplotlib.transforms import Transform, IdentityTransform
29 class ScaleBase:
File /opt/anaconda3/lib/python3.11/site-packages/matplotlib/ticker.py:143
141 import matplotlib as mpl
142 from matplotlib import _api, cbook
--> 143 from matplotlib import transforms as mtransforms
145 _log = logging.getLogger(__name__)
147 __all__ = ('TickHelper', 'Formatter', 'FixedFormatter',
148 'NullFormatter', 'FuncFormatter', 'FormatStrFormatter',
149 'StrMethodFormatter', 'ScalarFormatter', 'LogFormatter',
(...)
155 'MultipleLocator', 'MaxNLocator', 'AutoMinorLocator',
156 'SymmetricalLogLocator', 'AsinhLocator', 'LogitLocator')
File /opt/anaconda3/lib/python3.11/site-packages/matplotlib/transforms.py:49
46 from numpy.linalg import inv
48 from matplotlib import _api
---> 49 from matplotlib._path import (
50 affine_transform, count_bboxes_overlapping_bbox, update_path_extents)
51 from .path import Path
53 DEBUG = False
ImportError: numpy.core.multiarray failed to import
def show_images_playground(original, convolved, img_size):
# Mostra as imagens original o resultado da convolução
figure, axarr = plt.subplots(1,2, figsize=(6,6))
axarr[0].imshow(original, cmap= 'gray')
axarr[1].imshow(convolved, cmap= 'gray')
for ax in axarr.ravel():
# Configura major ticks
ax.set_xticks(np.arange(0, img_size, 1))
ax.set_yticks(np.arange(0, img_size, 1))
# Configura minor ticks
ax.set_xticks(np.arange(-.5, img_size, 1), minor=True)
ax.set_yticks(np.arange(-.5, img_size, 1), minor=True)
# Configura gridlines baseadas nos minor ticks
ax.grid(which='minor', color='b', linestyle='-', linewidth=2)
# Remove minor ticks
ax.tick_params(which='minor', bottom=False, left=False)
plt.show()
def show_images(original, convolved):
figure, axarr = plt.subplots(1,2, figsize=(10,10))
axarr[0].imshow(original, cmap= 'gray')
axarr[1].imshow(convolved, cmap= 'gray')
# Remove plt grid e ticks
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Playground: Testando filtros imagem binária#
# Cria imagem aletória
img_size = 16
rnd_img = np.random.randint(0, 2, size=(img_size,img_size),dtype=np.uint8)
kernel = np.array( # Define um kernel
[[0, 0, 0],
[0, 0, 1],
[0, 0, 0]],
np.float32)
resultado_img = cv2.filter2D(rnd_img, -1, kernel) # Convolução
show_images_playground(rnd_img, resultado_img, img_size)
Carregamento de Imagem#
def url_to_image(url, readFlag=cv2.IMREAD_GRAYSCALE):
# download the image, convert it to a NumPy array, and then read
# it into OpenCV format
resp = urlopen(url)
image = np.asarray(bytearray(resp.read()), dtype="uint8")
image = cv2.imdecode(image, readFlag)
# return the image
return image
img = url_to_image("https://www.flickr.com/photo_download.gne?id=16504233985&secret=9f1060624e&size=q&source=photoPageEngagement")
plt.figure(figsize=(3,3))
plt.imshow(img, cmap="gray")
plt.axis("off")
plt.show()
Filtro de Média#
Utilizado para suavização da imagem.
Diminui a nitidez pela redução de fortes transições de intensidade entre os pixels.
Filtro de Média: Aplicação#
# Define um kernel de suavização (média)
kernel = np.ones((3,3), np.float32) / 9
# Aplica a convolução com o kernel
media_img = cv2.filter2D(img, -1, kernel)
# Mostra as imagens original e suavizada
show_images(img, media_img)
Filtro de Média: Kernels de diferentes tamanhos#
# Cria a estrutura de plots para as imagens
figure, axarr = plt.subplots(1,5, figsize=(10,10))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
for cnt, size in enumerate([3, 5, 9, 15]):
# Define um kernel de suavização (média)
kernel = np.ones((size,size), np.float32) / (size**2)
# Aplica a convolução com o kernel
imagem_suavizada = cv2.filter2D(img, -1, kernel)
# Mostra as imagens original e suavizada
axarr[cnt+1].imshow(imagem_suavizada, cmap= 'gray')
axarr[cnt+1].set_title(f"Kernel ({size} x {size})")
# Remove plt grid e ticks
for ax in axarr.ravel():
ax.set_axis_off()
plt.tight_layout()
plt.show()
Filtro de Média: Diferentes valores de Kernel#
kernel_media = np.array([
[1, 2, 1],
[2, 4, 2],
[1, 2, 1],
]).astype(np.float16)
kernel_media /= kernel_media.sum()
imagem_suavizada = cv2.filter2D(img, -1, kernel_media)
figure, axarr = plt.subplots(1,2, figsize=(6,6))
axarr[0].imshow(img, cmap= 'gray')
axarr[1].imshow(imagem_suavizada, cmap= 'gray')
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Filtro Gaussiano#
Suavização: Filtro de média ponderada, mas com seus pesos seguindo uma aproximação da distribuição gaussiana.
\(G(x,y;\sigma)=\frac{1}{2\pi\sigma^{2}}\exp\!\left(-\,\frac{x^{2}+y^{2}}{2\sigma^{2}}\right)\)
Note que o valor resultante para o elemento central pode ser um valor não existente na imagem original.


Fonte da Imagem: Towards AI.
Filtro Gaussiano: Aplicação#
# Suavização Gaussiana (Filtro Gaussiano)
kernel_size = (5, 5)
sigma = 1.0
# Aplica o filtro Gaussiano
blurred = cv2.GaussianBlur(img, kernel_size, sigmaX=sigma)
figure, axarr = plt.subplots(1,2, figsize=(6,6))
axarr[0].imshow(img, cmap= 'gray')
axarr[1].imshow(blurred, cmap= 'gray')
# Remove plt grid e ticks
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Filtro Gaussiano: Testando diferentes valores de \(\sigma\)#
# Cria a estrutura de plots para as imagens
figure, axarr = plt.subplots(1,5, figsize=(10,5))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
for cnt, sigma in enumerate([0.5, 1, 1.5, 2]):
# Aplica o filtro Gaussiano
gauss_img = cv2.GaussianBlur(img, kernel_size, sigmaX=sigma)
# Mostra as imagens original e suavizada
axarr[cnt+1].imshow(gauss_img, cmap= 'gray')
axarr[cnt+1].set_title(f"Sigma: {sigma}")
ax.set_axis_off()
# Remove plt grid e ticks
for ax in axarr.ravel():
ax.set_axis_off()
plt.tight_layout()
plt.show()
Comparação: Filtro de Média versus Filtro Gaussiano#
kernel_size = (5, 5)
avg_img = cv2.blur(img, kernel_size)
gaussian_img = cv2.GaussianBlur(img, kernel_size, sigmaX=1.0)
figure, axarr = plt.subplots(1,3, figsize=(8,8))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
axarr[1].imshow(avg_img, cmap= 'gray')
axarr[1].set_title(f"Filtro Média {str(kernel_size).replace(',', ' x ')}")
axarr[2].imshow(gaussian_img, cmap= 'gray')
axarr[2].set_title(f"Filtro de Gaussiano {str(kernel_size).replace(',', ' x ')}")
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Filtro Mediana#
Elimina picos isolados (outliers).
Substitui o valor de um pixel pela mediana dos valores de intensidade na vizinhança desse pixel.
Fonte da Imagem: ResearchGate.
Filtro Mediana: Aplicação#
# Aplica filtro de mediana
median_filtered = cv2.medianBlur(img, ksize=3)
figure, axarr = plt.subplots(1,2, figsize=(8,8))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
axarr[1].imshow(median_filtered, cmap= 'gray')
axarr[1].set_title("Imagem Filtrada pela Mediana")
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Filtro de Mediana: Removendo Ruído Salt-and-Pepper#
def add_salt_and_pepper_noise(image, noise_ratio=0.02):
noisy_image = image.copy()
h, w = noisy_image.shape
noisy_pixels = int(h * w * noise_ratio)
for _ in range(noisy_pixels):
row, col = np.random.randint(0, h), np.random.randint(0, w)
if np.random.rand() < 0.5:
noisy_image[row, col] = 0
else:
noisy_image[row, col] = 255
return noisy_image
ruido_img = add_salt_and_pepper_noise(img)
mediana_filtrada_img = cv2.medianBlur(ruido_img, ksize=3)
figure, axarr = plt.subplots(1,3, figsize=(11,8))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
axarr[1].imshow(ruido_img, cmap= 'gray')
axarr[1].set_title("Imagem Ruidosa (Salt and Pepper)")
axarr[2].imshow(mediana_filtrada_img, cmap= 'gray')
axarr[2].set_title("Imagem Filtrada pela Mediana")
# Remove plt grid e ticks
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Filtro Sobel#
O filtro de Sobel é um operador discreto de derivação, projetado para estimar a magnitude do gradiente de intensidade em imagens digitais. \(\rightarrow\) Combina duas convoluções separadas: uma kernel \(h_x\) que responde à variação horizontal e outra \(h_y\) que captura a variação vertical.
A combinação das respostas \(\sqrt{(I * h_x)^2 + (I * h_y)^2}\) fornece uma aproximação robusta da magnitude do gradiente, enquanto o sinal de cada componente indica a direção local do aumento ou diminuição de intensidade.
Eficaz na detecção de bordas: Enfatiza regiões com transições rápidas de luminância. Suaviza ruídos graças à integração de ponderações gaussiana-like nos kernels.
Filtro Sobel: Exemplo#
Filtro Sobel: Aplicação#
sobel_img = cv2.Sobel(img, ddepth=-1, dx=1, dy=0, ksize=3)
figure, axarr = plt.subplots(1,2, figsize=(8,8))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
axarr[1].imshow(sobel_img, cmap= 'gray')
axarr[1].set_title("Filtro Sobel")
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Filtro Laplaciano#
O operador laplaciano é uma segunda derivada discreta que mede a divergência do gradiente de intensidade de uma imagem.
\(Laplace(f) = \dfrac{\partial^{2} f}{\partial x^{2}} + \dfrac{\partial^{2} f}{\partial y^{2}}\)
Captura a divergência do gradiente de intensidade de uma imagem, ou seja, quantifica as regiões onde a curvatura da luminância muda drasticamente.
Soma ponderada dos vizinhos diretos do pixel central, subtraindo quatro vezes seu valor.
Destaca pontos de mudança abrupta — bordas e cantos — mas não indica a direção dessas transições.
Kernels laplacianos geralmente incluem valores negativos na vizinhança e um valor igual à soma destes valores negativos no centro, mas com sinal invertido: $\(K = \begin{bmatrix}0 & -1 & 0\\ -1 & 4 & -1\\ 0 & -1 & 0\end{bmatrix}\)$
Filtro Laplaciano: Aplicação#
laplacean_img = cv2.Laplacian(img, ddepth=-1, ksize=3)
figure, axarr = plt.subplots(1,2, figsize=(8,8))
axarr[0].imshow(img, cmap= 'gray')
axarr[0].set_title("Imagem Original")
axarr[1].imshow(laplacean_img, cmap= 'gray')
axarr[1].set_title("Filtro Laplaciano")
for ax in axarr.ravel():
ax.set_axis_off()
plt.show()
Outros Filtros#
Prewitt
Operador linear de 3×3 usado para detecção de bordas.
Calcula aproximações das derivadas parciais ∂I/∂x e ∂I/∂y.
$\( G_x=\begin{bmatrix}-1&0&1\\-1&0&1\\-1&0&1\end{bmatrix},\quad G_y=\begin{bmatrix}-1&-1&-1\\0&0&0\\1&1&1\end{bmatrix} \)$Resultado: imagem com bordas destacadas; suaviza ruído moderado, porém menos sensível que Sobel.
Outros Filtros (cont.)#
Max (Filtro de Maxima)
Operador não linear que substitui cada pixel pelo maior valor dentro do vizinho definido.
Reduz ruído impulsivo “salt & pepper”, preservando detalhes mais claros.
Resultado: imagem com regiões saturadas ampliadas; pode gerar bordas suavizadas em áreas escuras.
Min (Filtro de Minima)
Operador não linear que substitui cada pixel pelo menor valor dentro do vizinho.
Útil para eliminar ruído impulsivo salt and pepper nas áreas claras.
Resultado: diminuição de brilho local, bordas mais suaves em regiões escuras.
Resumo#
|
Leitura Recomendada: Seções 3.4 a 3.7. |