Em um ambiente, um agente gera uma sequência de ações segundo as percepções que recebe. Cada ação do agente pode causar uma transformação no ambiente (mudar seu estado).
Mas como saber se a sequência de ações realizadas pelo agente foi desejável?
Como saber se o agente teve bom desempenho?
Para quem não sabe para onde vai, qualquer caminho serve.
Lewis Caroll. Alice no País das Maravilhas
Agente Racional
"Para cada sequência de percepções possível, um agente racional deve selecionar uma ação que se espera venha a maximizar sua medida de desempenho, dada a evidência fornecida pela sequência de percepções e por qualquer conhecimento interno do agente."
Russel e Norvig. Inteligência Artificial: Uma Abordagem Moderna.
Modelo PEAS para agentes racionais
P: Performance (Desempenho) → Conjunto de métricas para avaliar o quão bem o agente cumpre sua tarefa.
Exemplos: acurácia, eficiência de tempo de resposta, eficiência energética
Objetivo: maximizar (ou minimizar) essas métricas conforme a tarefa.
E: Environment (Ambiente) → Domínio onde o agente opera, incluindo todas as entidades externas e suas regras.
Tipos: estático/dinâmico, determinístico/não-determinístico, parcialmente observável, etc.
Determina quais percepções são disponíveis e que ações podem ser tomadas.
A: Actuators (Atuadores) → Conjunto de dispositivos ou interfaces que permitem ao agente modificar o ambiente.
Exemplos: motores, APIs, comandos de sistema, mensagens de rede, etc.
S: Sensors (Sensores) → Meios pelos quais o agente obtém informações sobre o estado do ambiente.
Exemplos: câmeras, microfones, sensores de temperatura, dados, leituras de API.
A qualidade e a cobertura dos sensores determinam o grau de observabilidade.
Construindo agentes inteligentes no modelo PEAS
Defina a tarefa: Determine quais são as metas do agente (ex.: “navegar pelo labirinto”).
Especifique P: Escolha métricas claras que quantifiquem sucesso (ex.: número de passos até o objetivo, tempo total, custo energético).
Descreva E: Modele o ambiente em termos de estado inicial, transições e observabilidade.
Liste S: Identifique quais percepções são necessárias para tomar decisões corretas.
Determine A: Especifique quais ações podem ser executadas pelo agente para alterar o ambiente.
Propriedades-chave do Ambiente
Propriedade
Descrição
Observabilidade
Completa – o agente recebe todo o estado; Parcial – só recebe parte das percepções.
Determinismo
Determinístico – a mesma ação em um mesmo estado sempre gera o mesmo próximo estado; Estocástico – há probabilidade associada às transições.
Dinamicidade
Estático – o ambiente não muda enquanto o agente decide; Dinâmico – pode mudar independentemente das ações do agente (ex.: outros agentes, ruído).
Discretização
Discreto – estado e ação são contáveis e finitos; Contínuo – variáveis podem assumir qualquer valor em um intervalo.
Sequencialidade
Episódico – cada decisão está isolada de outras (ex.: jogar cartas); Sequencial – decisões se acumulam ao longo do tempo, influenciando futuras escolhas (ex.: planejamento).
Agente Único vs. Multi‑Agente
Único – o ambiente contém apenas um agente que interage com elementos não agentes. Multi‑Agente – múltiplos agentes coexistem e podem cooperar, competir ou se comunicar, alterando a dinâmica do problema (ex.: jogos, sistemas de negociação, swarm robotics).
Principais Tipos de Agentes Inteligentes
Agente Reativo Simples: Decide a partir da percepção atual, sem memória interna das percepções anteriores.
Simplicidade de implementação, baixo custo computacional
Incapaz de lidar com mudanças que exigem planejamento futuro ou aprendizado de estados anteriores.
Regras do tipo: Se X então Y.
Agente Reativo Baseado em Modelo: Mantém um modelo interno do ambiente (M) e atualiza-o a cada percepção: M ← update(M,P); então escolhe uma ação.
Modelo de mundo: conhecimento de como o ambiente funciona.
Pode antecipar consequências, lidar com incerteza parcial e adaptar-se a mudanças inesperadas.
Requer especificação correta do modelo. Pode ser difícil de escalar para ambientes complexos.
Principais Tipos de Agentes Inteligentes (cont.)
Agente Baseado em Objetivos: Possui uma função objetivo que avalia o quão perto está de atingir metas e escolhe ações que maximizam essa avaliação: .
Pode ser aplicado a problemas de busca e planejamento.
Precisa de um modelo do ambiente ou de simulações.
Agentes Baseados em Utilidade: Maximizam uma função de utilidade que quantifica a "qualidade" de cada estado .
Função de utilidade (pré‑definida ou aprendida).
Modelo do ambiente (determinístico ou probabilístico).
Algoritmo de decisão (ex.: busca, aprendizado por reforço).
Flexível: pode integrar múltiplas métricas (tempo, custo, segurança) em uma única função. Pode se adaptar a ambientes incertos e dinâmicos graças ao cálculo de valores esperados.
Principais Tipos de Agentes Inteligentes (cont.)
Agentes baseados em aprendizado: Melhorar a performance ao longo do tempo por meio da experiência adquirida.
Baseados no conceito de aprendizado de máquina (Machine Learning).
Aprendizado Supervisionado – treina com exemplos rotulados.
Aprendizado Não‑Supervisionado – extrai padrões sem rótulos.
Aprendizado por Reforço – aprende via recompensas em ambientes interativos.
Necessita grande quantidade de dados ou interação prolongada.
Exemplos Modernos de Agentes Inteligentes
Área
Exemplo
Tipo de agente
Como funciona?
Robótica
Roomba (aspirador autônomo)
Reativo + Modelo simples
Sensores IR → mapeamento local, evasão de obstáculos
Assistência Virtual
Alexa, Siri
Baseado em modelo + aprendizado
Processamento de linguagem natural → execução de ações via API
Jogos
AlphaGo
Aprendizagem por reforço + busca (Monte‑Carlo Tree Search)
Gera jogadas baseadas em avaliação neural e simulações
Agentes Baseados em Busca (tema da próxima aula)
Problema de busca: estado inicial → objetivo; transições → ações.
Estratégias: busca não informada (BFS, DFS), informada (A*, Greedy).
Agente de busca: aplica um algoritmo de busca para gerar sequência de ações.
Resumo e Próximos Passos
Agentes inteligentes são estruturas fundamentais em IA.
Uma medida de desempenho avalia o comportamento do agente em um ambiente.
Um agente racional age para maximizar o valor esperado da medida de desempenho, dada a sequência de percepções recebida até o momento.
Ações de um agente podem alterar o estado do ambiente.
Mecanismos de busca podem ser usados por agentes para resolver problemas complexos.
Atividade recomendada: Leitura do capítulo 2.
Perguntas para Discussão
Qual a principal vantagem de usar um agente baseado em modelo versus simplesmente reativo?
Como os agentes podem lidar com ambientes parcialmente observáveis?
Em ambientes multi‑agentes, que desafios adicionais surgem na definição da função de utilidade de cada agente?
Quais são as implicações éticas de permitir que agentes aprendam de forma autônoma em ambientes com humanos?
Como sensores falhos ou ruído alto afetariam o funcionamento de agentes?