Skip to content

Projeto I

Entrega

📆 30.set 🕒 23:59

Grupo do Projeto Integrador

Entrega do link do projeto via Canvas.


O link deve apontar para uma página pública do GitHub contendo a documentação (relatório) e o repositório do projeto.

Obrigatório: o uso de mkdocs ou similar para a documentação do projeto. Utilize o template: template-projeto-integrador.

O Projeto I é uma atividade prática que visa aplicar os conceitos aprendidos nas aulas de Machine Learning. O objetivo é desenvolver um modelo de aprendizado de máquina utilizando um conjunto de dados real, realizando desde a exploração dos dados até a avaliação do modelo.

Para este projeto, você pode escolher um conjunto de dados disponível em plataformas como o Kaggle Datasets ou utilizar um conjunto de dados próprio.

O projeto pode ser focado em classificação ou regressão, dependendo do conjunto de dados escolhido. É importante que o conjunto de dados tenha características que permitam a aplicação de diferentes algoritmos de aprendizado de máquina, como Decision Tree, K-Nearest Neighbors (KNN) e K-Means.

O projeto deve incluir as seguintes etapas:

  1. Exploração dos Dados: Análise inicial do conjunto de dados, incluindo visualizações e estatísticas descritivas.
  2. Pré-processamento: Limpeza dos dados, tratamento de valores ausentes e normalização.
  3. Divisão dos Dados: Separação do conjunto de dados em treino e teste.
  4. Treinamento do Modelo:
    • Decision Tree.
    • K-Nearest Neighbors (KNN).
    • K-Means.
  5. Avaliação dos Modelos: Avaliação do desempenho dos modelos utilizandos com as métricas apropriadas.
  6. Relatório Final: Documentação do processo, resultados obtidos e possíveis melhorias.

Pode ser utilizado bibliotecas como pandas, numpy, matplotlib e scikit-learn para auxiliar no desenvolvimento do projeto.

Rubrica de Avaliação

Critério Descrição Pontos
Exploração dos Dados Análise inicial do conjunto de dados, incluindo visualizações e estatísticas descritivas. 15
Pré-processamento Limpeza dos dados, tratamento de valores ausentes e normalização. 20
Divisão dos Dados Separação do conjunto de dados em treino e teste. 10
Treinamento do Modelo Implementação dos modelos Decision Tree, KNN e K-Means. 15
Avaliação dos Modelos Avaliação e comparação do desempenho dos modelos utilizando métricas apropriadas. 30
Relatório Final Documentação do processo, resultados obtidos e possíveis melhorias. 10