
Na imagem: (a) Exemplo de um SOM. (b) Example de um mapa topológico de neurônios no cérebro humano, correspondente ao córtex auditivo. Fonte: Marta Pedró et al.
SOM aprende a preservar a topologia dos dados.
![]()
Ilustração do treinamento de SOM (grade) para se moldar à distribuição dos dados (em azul). Fonte da Imagem: Wikipedia.
SOM aprende a preservar a topologia dos dados.

Exemplos de SOM em topologias (A) quadrada e (B) circular. Fonte da Imagem: https://gdetor.github.io/posts/som/.


SOM treinado com dados de qualidade de vida do Banco Mundial. Fonte: GeoInsights.

Dados anotados (labeled data) na área da Saúde são caros e difÃceis de obter em larga escala. Fonte da Imagem: Macgence.
Escassez de Dados Rotulados: Obter dados rotulados
Fonte da Imagem: Naskath Jahangeer @ResearchGate
Passo 1: encontrar o BMU:
Ou seja: escolhemos o neurônio cujo vetor de pesos está mais próximo do dado.
Passo 2: atualizar o BMU e seus vizinhos
Depois de encontrar o BMU, atualizamos seus pesos e os pesos dos neurônios vizinhos.
Onde:
Quanto mais perto o neurônio está do BMU na grade, maior é sua atualização.
O SOM usa dois esquemas de decaimento para se estabilizar:
Decaimento da taxa de aprendizagem:
Decaimento do raio de vizinhança:
Se
ou decaem rápido demais, o mapa fica preso em um mÃnimo local. Se decaem lentamente demais, o mapa nunca converge.
No inÃcio:
Depois:
Fonte da Imagem: https://bsd.neuroinf.jp.
Veja também o vÃdeo: Auto learning face images with Self Organizing Maps, by MITECH Corp.
O SOM combina três ideias poderosas:
Ele cria uma superfÃcie organizada para explorar padrões.
Na imagem: Mapa de exploração para compra de dados. Fonte: Martins and Vossen. "Self-organizing maps for data purchase support in data marketplaces." ICCCI 2023.
Diferente do K-Means (que encontra centros), o SOM preserva relações de vizinhança.
Fonte da Imagem: Wikipedia
Erro de quantização: mede o quanto os dados estão próximos de seus BMUs.
Erro topográfico: mede se o SOM preserva vizinhanças.
Onde
Uma visualização clássica do SOM é a U-Matrix.
Ela mostra distâncias entre neurônios vizinhos.
Fonte da Imagem: StackOverflow.
Problema com SOM: Grades fixas forçam os dados em formas retangulares.
Solução: GNG usa um grafo dinâmico de nós.
Regra de Atualização:
Com
Fonte da imagem: Chris von Csefalvay.
Integração com Deep Learning: gerar embeddings com uma rede profunda e treinar um SOM sobre os embeddings. Exemplo: SOM-CPC.
TopoNets: Vision-Language Models que preservam topologia (veja abaixo).

Mesmo mapas inteligentes podem se perder quando o terreno é complexo demais.
Dados de alta dimensionalidade: o desempenho se degrada em dimensões muito altas (maldição da dimensionalidade).
Sensibilidade a parâmetros: escolher
Escalabilidade: complexidade de
Se você gosta de inteligência artificial, ciência de dados e resolver problemas complexos, então nosso time é o lugar certo para você.

Contato: martins.denis@usp.br
Site e GitHub: https://denmartins.github.io
