Projeto I
Entrega
30.set
23:59
Grupo do Projeto Integrador
Entrega do link do projeto via Canvas.
O link deve apontar para uma página pública do GitHub contendo a documentação (relatório) e o repositório do projeto.
Obrigatório: o uso de mkdocs ou similar para a documentação do projeto. Utilize o template: template-projeto-integrador.
O Projeto I é uma atividade prática que visa aplicar os conceitos aprendidos nas aulas de Machine Learning. O objetivo é desenvolver um modelo de aprendizado de máquina utilizando um conjunto de dados real, realizando desde a exploração dos dados até a avaliação do modelo.
Para este projeto, você pode escolher um conjunto de dados disponível em plataformas como o Kaggle Datasets ou utilizar um conjunto de dados próprio.
O projeto pode ser focado em classificação ou regressão, dependendo do conjunto de dados escolhido. É importante que o conjunto de dados tenha características que permitam a aplicação de diferentes algoritmos de aprendizado de máquina, como Decision Tree, K-Nearest Neighbors (KNN) e K-Means.
O projeto deve incluir as seguintes etapas:
- Exploração dos Dados: Análise inicial do conjunto de dados, incluindo visualizações e estatísticas descritivas.
- Pré-processamento: Limpeza dos dados, tratamento de valores ausentes e normalização.
- Divisão dos Dados: Separação do conjunto de dados em treino e teste.
- Treinamento do Modelo:
- Decision Tree.
- K-Nearest Neighbors (KNN).
- K-Means.
- Avaliação dos Modelos: Avaliação do desempenho dos modelos utilizandos com as métricas apropriadas.
- Relatório Final: Documentação do processo, resultados obtidos e possíveis melhorias.
Pode ser utilizado bibliotecas como pandas
, numpy
, matplotlib
e scikit-learn
para auxiliar no desenvolvimento do projeto.
Rubrica de Avaliação
Critério | Descrição | Pontos |
---|---|---|
Exploração dos Dados | Análise inicial do conjunto de dados, incluindo visualizações e estatísticas descritivas. | 15 |
Pré-processamento | Limpeza dos dados, tratamento de valores ausentes e normalização. | 20 |
Divisão dos Dados | Separação do conjunto de dados em treino e teste. | 10 |
Treinamento do Modelo | Implementação dos modelos Decision Tree, KNN e K-Means. | 15 |
Avaliação dos Modelos | Avaliação e comparação do desempenho dos modelos utilizando métricas apropriadas. | 30 |
Relatório Final | Documentação do processo, resultados obtidos e possíveis melhorias. | 10 |