Objetivo

Desenvolver, por grupos de até três alunos, um projeto interdisciplinar que integre os seguintes elementos:

Estrutura do Projeto

Etapa Descrição resumida
Definição do Tema Escolha temática (ex.: análise de sentimento em redes sociais, previsão de churn corporativo, detecção de fake news) e escopo de aplicação LLM.
Coleta de Dados Aquisição via APIs REST, web‑scraping, repositórios públicos (Kaggle, UCI ML Repository).
Exploração e Visualização Estatísticas descritivas, histogramas, boxplots, heatmaps, dashboards interativos (Plotly Dash / Streamlit).
Transformaçãode Dados Limpeza, imputação, codificação de variáveis categóricas, normalização/estandardização, geração de embeddings.
Modelagem Classificadores/regressões clássicos (Random Forest, XGBoost) e comparação com LLM.
Integração LLM Fine‑tuning ou prompt‑engineering para tarefa específica; avaliação qualitativa/quantitativa.
Avaliação & Métricas Accuracy, F1‑score, ROC‑AUC, BLEU (para geração), Human‑in‑the‑Loop feedback.
Documentação & Apresentação Relatório técnico (10 páginas) + Slides de apresentação + Código aberto no GitHub.

Entregáveis

Entregável Formato
Relatório Técnico PDF (cerca de 10 páginas) com metodologia, resultados e discussões éticas
Apresentação Oral Slides (Beamer/PowerPoint), 15 minutos + Q&A
Código Fonte Repositório GitHub/Bitbucket com README detalhado
Dataset Processado Arquivo CSV/Parquet/etc. e script de ingestão
Dashboard Interativo App Streamlit/Dash

Critérios de avaliação

Diretrizes Técnicas

  1. Reprodutibilidade
  2. Ética e Conformidade
  3. Documentação
  4. Apresentação