Projeto I

Entrega

30.set 23:59

Grupo do Projeto Integrador

Entrega do link do projeto via Canvas.

O link deve apontar para uma página pública do GitHub contendo a documentação (relatório) e o repositório do projeto.

Obrigatório: o uso de mkdocs ou similar para a documentação do projeto. Utilize o template: template-projeto-integrador.

O Projeto I é uma atividade prática que visa aplicar os conceitos aprendidos nas aulas de Machine Learning. O objetivo é desenvolver um modelo de aprendizado de máquina utilizando um conjunto de dados real, realizando desde a exploração dos dados até a avaliação do modelo.

Para este projeto, você pode escolher um conjunto de dados disponível em plataformas como o Kaggle Datasets ou utilizar um conjunto de dados próprio.

O projeto pode ser focado em classificação ou regressão, dependendo do conjunto de dados escolhido. É importante que o conjunto de dados tenha características que permitam a aplicação de diferentes algoritmos de aprendizado de máquina, como Decision Tree, K-Nearest Neighbors (KNN) e K-Means.

O projeto deve incluir as seguintes etapas:

Exploração dos Dados: Análise inicial do conjunto de dados, incluindo visualizações e estatísticas descritivas.
Pré-processamento: Limpeza dos dados, tratamento de valores ausentes e normalização.
Divisão dos Dados: Separação do conjunto de dados em treino e teste.
Treinamento do Modelo:
- Decision Tree.
- K-Nearest Neighbors (KNN).
- K-Means.
Avaliação dos Modelos: Avaliação do desempenho dos modelos utilizandos com as métricas apropriadas.
Relatório Final: Documentação do processo, resultados obtidos e possíveis melhorias.

Pode ser utilizado bibliotecas como pandas, numpy, matplotlib e scikit-learn para auxiliar no desenvolvimento do projeto.

Rubrica de Avaliação

Critério	Descrição	Pontos
Exploração dos Dados	Análise inicial do conjunto de dados, incluindo visualizações e estatísticas descritivas.	15
Pré-processamento	Limpeza dos dados, tratamento de valores ausentes e normalização.	20
Divisão dos Dados	Separação do conjunto de dados em treino e teste.	10
Treinamento do Modelo	Implementação dos modelos Decision Tree, KNN e K-Means.	15
Avaliação dos Modelos	Avaliação e comparação do desempenho dos modelos utilizando métricas apropriadas.	30
Relatório Final	Documentação do processo, resultados obtidos e possíveis melhorias.	10