Definição do Tema |
Escolha temática (ex.: análise de sentimento em redes sociais,
previsão de churn corporativo, detecção de fake news) e escopo de
aplicação LLM. |
Coleta de Dados |
Aquisição via APIs REST, web‑scraping, repositórios públicos
(Kaggle, UCI ML Repository). |
Exploração e Visualização |
Estatísticas descritivas, histogramas, boxplots, heatmaps,
dashboards interativos (Plotly Dash / Streamlit). |
Transformaçãode Dados |
Limpeza, imputação, codificação de variáveis categóricas,
normalização/estandardização, geração de embeddings. |
Modelagem |
Classificadores/regressões clássicos (Random Forest, XGBoost) e
comparação com LLM. |
Integração LLM |
Fine‑tuning ou prompt‑engineering para tarefa específica; avaliação
qualitativa/quantitativa. |
Avaliação & Métricas |
Accuracy, F1‑score, ROC‑AUC, BLEU (para geração), Human‑in‑the‑Loop
feedback. |
Documentação & Apresentação |
Relatório técnico (10 páginas) + Slides de apresentação + Código
aberto no GitHub. |