def set_device(on_gpu=True):
    has_mps = torch.backends.mps.is_available()
    has_cuda = torch.cuda.is_available()
    return "mps" if (has_mps and on_gpu) \
            else "cuda" if (has_cuda and on_gpu) \
            else "cpu"

device = set_device(on_gpu=True)

class Perceptron():
    def __init__(self, num_features):
        self.num_features = num_features
        self.weights = torch.zeros(
            num_features, 1, dtype=torch.float32, device=device)
        self.bias  = torch.zeros(1, dtype=torch.float32, device=device)
        self.ones  = torch.ones(1, device=device) 
        self.zeros = torch.zeros(1, device=device)

    def forward(self, x):
        linear = torch.mm(x, self.weights) + self.bias
        predictions = torch.where(linear > 0., self.ones, self.zeros)
        return predictions
        
    def backward(self, x, y):  
        predictions = self.forward(x)
        errors = y - predictions
        return errors
        
    def train(self, x, y, epochs):
        for _ in range(epochs):
            for i in range(y.shape[0]):
                errors = self.backward(
                    x[i].reshape(1, self.num_features), y[i]).reshape(-1)
                self.weights += (errors * x[i]).reshape(self.num_features, 1)
                self.bias += errors
                
    def evaluate(self, x, y):
        predictions = self.forward(x).reshape(-1)
        accuracy = torch.sum(predictions == y).float() / y.shape[0]
        return accuracy

ppn = Perceptron(num_features=2)

X_train_tensor = torch.tensor(
    X_train, 
    dtype=torch.float32, 
    device=device)
y_train_tensor = torch.tensor(
    y_train, 
    dtype=torch.float32, 
    device=device)

ppn.train(X_train_tensor, y_train_tensor, epochs=5)

print('Model parameters:')
print('\tWeights:', ppn.weights.tolist())
print('\tBias: ', ppn.bias.tolist())

Model parameters:
	Weights: [[-1.0376710891723633], [-1.455593466758728]]
	Bias:  [0.0]

X_test_tensor = torch.tensor(
    X_test, 
    dtype=torch.float32, 
    device=device)
y_test_tensor = torch.tensor(
    y_test, 
    dtype=torch.float32, 
    device=device)

test_acc = ppn.evaluate(X_test_tensor, y_test_tensor)
print(f'Test set accuracy: {(test_acc*100):.2f}%')

Test set accuracy: 96.67%

from IPython.display import YouTubeVideo
YouTubeVideo("aircAruvnKk", width=600, height=350)

from torchvision import datasets
import torchvision.transforms as transforms
import torch.utils.data as data

# Número de processos para o dataloader
NUM_WORKERS = 0
# Quantas amostras (imagens) por batch
BATCH_SIZE = 128
# Converte dados em tensores
transform = transforms.ToTensor()

# Carrega dados de treino e teste
train_data = datasets.MNIST(root='data', train=True,
    download=True, transform=transform)
test_data = datasets.MNIST(root='data', train=False,
    download=True, transform=transform)

# Cria dataset de validação
VALIDATION_SIZE = 0.1
n_train_examples = int(len(train_data) * VALIDATION_SIZE)
n_valid_examples = len(train_data) - n_train_examples

train_data, valid_data = data.random_split(
    train_data, [n_train_examples, n_valid_examples])

# Data Loaders
train_loader = torch.utils.data.DataLoader(train_data, shuffle=True, 
   batch_size=BATCH_SIZE, num_workers=NUM_WORKERS)
valid_loader = torch.utils.data.DataLoader(valid_data,
   batch_size=BATCH_SIZE, num_workers=NUM_WORKERS)
test_loader = torch.utils.data.DataLoader(test_data, 
  batch_size=BATCH_SIZE, num_workers=NUM_WORKERS)

import torch.nn as nn
import torch.nn.functional as F

class MLPNet(nn.Module):
    def __init__(self):
        super(MLPNet, self).__init__()
        self.flatten = nn.Flatten()
        # input layer
        self.fc1 = nn.Linear(28 * 28, 64)
        # linear layer (n_hidden -> hidden_2)
        self.fc2 = nn.Linear(64, 32)
        # linear layer (n_hidden -> 10)
        self.fc3 = nn.Linear(32, 10)
        
    def forward(self, x):
        x = self.flatten(x)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

import torch.optim as optim

EPOCHS = 10
device = set_device(on_gpu=True)
model = MLPNet().to(device)
loss_function = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.02)

num_parameters = sum(p.numel() for p in model.parameters() if p.requires_grad)
print(f"Num. Parâmetros no modelo:", num_parameters)

Num. Parâmetros no modelo: 52650

from IPython.display import YouTubeVideo
YouTubeVideo("Nutpusq_AFw", width=600, height=350)

epoch_ticks = [i+1 for i in range(EPOCHS)]
plt.figure(figsize=(4,3))
plt.plot(epoch_ticks, tr_loss, "-o", label="Train. Loss")
plt.plot(epoch_ticks, val_loss, "--^", label="Valid. Loss")
plt.xlabel('Epoch')
plt.xlabel('Loss')
plt.title("Comportamento da Loss")
plt.legend(loc='lower left', fontsize=8)
plt.show()

def get_predictions(model, iterator, device):
    model.eval()
    images, labels, probs = [], [], []
    with torch.no_grad():
        for (x, y) in iterator:
            x = x.view(-1, 28*28).to(device)
            y = y.to(device)
            
            y_pred = model(x)
            y_prob = F.softmax(y_pred, dim=-1)
        
            images.append(x.cpu())
            labels.append(y.cpu())
            probs.append(y_prob.cpu())
    images = torch.cat(images, dim=0)
    labels = torch.cat(labels, dim=0)
    probs = torch.cat(probs, dim=0)
    
    return images, labels, probs

images, labels, probs = get_predictions(model, test_loader, device)
pred_labels = torch.argmax(probs, 1)

import sklearn.metrics as mtr
import seaborn as sns
fig = plt.figure(figsize=(7, 5))
ax = fig.add_subplot(1, 1, 1)
cm = mtr.confusion_matrix(labels, pred_labels)
sns.heatmap(
    cm, annot=True, fmt='d', cmap='bone_r', cbar=False,
    square=True, linewidths=3, linecolor="w", ax=ax)
plt.show()

import numpy as np

dataiter = iter(test_loader)
images, labels = next(dataiter)
images = images.view(-1, 28*28).to(device)
labels = labels.to(device)

output = model(images)
_, preds = torch.max(output, 1)
images = images.cpu()

fig = plt.figure(figsize=(3, 3))
for idx in np.arange(20):
    ax = fig.add_subplot(4, int(20/4), idx+1, xticks=[], yticks=[])
    ax.imshow(images[idx].view(28,28), cmap='gray')
    ax.set_title("{} ({})".format(str(preds[idx].item()), str(labels[idx].item())),
                 color=("green" if preds[idx]==labels[idx] else "red"))
plt.tight_layout()
plt.show()

torch.save(model.state_dict(), "mlp-mnist-model.pth")

model = MLPNet()
model.load_state_dict(torch.load("mlp-mnist-model.pth"))
model.eval();

Visão Computacional ¶

Redes Neurais para Classificação de imagens¶

Prof. Dr. Denis Mayr Lima Martins ¶

Pontifícia Universidade Católica de Campinas ¶

Objetivos de Aprendizagem¶

Neurônio Artificial¶

Perceptron¶

Perceptron Learning Rule¶

Perceptron em Pytorch¶

Treinando o Modelo¶

Avaliando o Modelo nos dados de Teste¶

Visualizando a Fronteira de Decisão¶

Perceptron é um modelo flexível¶

Adaline: Adaptive Linear Neuron¶

Gradiente Descendente¶

Gradiente Descendente (cont.)¶

Gradiente Descendente¶

Limitação do Perceptron¶

Perceptron: Limitações¶

Funções de Ativação (Não-lineares)¶

Redes Neurais: Empilhando Perceptrons¶

MLP: Demo Visual¶

Redes Neurais: Empilhando Perceptrons¶

MLP: Treinamento¶

MLP: Feed-forward¶

MLP: Feed-Forward (cont.)¶

MLP: Feed-Forward (cont.)¶

Componentes de uma Rede Neural¶

MLP para Classificação de Imagens¶

MLP para o MNIST dataset¶

MLP MNIST: Tutorial Visual (YouTube)¶

MLP e MNIST em Pytorch¶

Arquitetura da Rede Neural¶

Função de Custo/Loss para Classificação¶

Testando o Modelo¶

Função de Ativação na Camada de Saída¶

Salvando o modelo¶

Carregando o modelo¶

Resumo¶

Visão Computacional¶

Redes Neurais para Classificação de imagens¶

Prof. Dr. Denis Mayr Lima Martins¶

Pontifícia Universidade Católica de Campinas¶

Objetivos de Aprendizagem¶

Neurônio Artificial¶

Perceptron¶

Perceptron Learning Rule¶

Perceptron em Pytorch¶

Treinando o Modelo¶

Avaliando o Modelo nos dados de Teste¶

Visualizando a Fronteira de Decisão¶

Perceptron é um modelo flexível¶

Adaline: Adaptive Linear Neuron¶

Gradiente Descendente¶

Gradiente Descendente (cont.)¶

Gradiente Descendente¶

Limitação do Perceptron¶

Perceptron: Limitações¶

Funções de Ativação (Não-lineares)¶

Redes Neurais: Empilhando Perceptrons¶

MLP: Demo Visual¶

Redes Neurais: Empilhando Perceptrons¶

MLP: Treinamento¶

MLP: Feed-forward¶

MLP: Feed-Forward (cont.)¶

MLP: Feed-Forward (cont.)¶

Componentes de uma Rede Neural¶

MLP para Classificação de Imagens¶

MLP para o MNIST dataset¶

MLP MNIST: Tutorial Visual (YouTube)¶

MLP e MNIST em Pytorch¶

Arquitetura da Rede Neural¶

Função de Custo/Loss para Classificação¶

Testando o Modelo¶

Função de Ativação na Camada de Saída¶

Salvando o modelo¶

Carregando o modelo¶

Resumo¶

Visão Computacional ¶

Prof. Dr. Denis Mayr Lima Martins ¶

Pontifícia Universidade Católica de Campinas ¶