6.3. Exercise
Exercício
Dentre os datasets disponíveis, escolha um cujo objetivo seja prever uma variável categórica (classificação). Utilize os algoritmos de KNN e K-Means para treinar um modelo e avaliar seu desempenho.
Utilize as bibliotecas pandas
, numpy
, matplotlib
e scikit-learn
para auxiliar no desenvolvimento do projeto.
A entrega deve ser feita através do Canvas - Exercício Métricas. Só serão aceitos links para repositórios públicos do GitHub contendo a documentação (relatório) e o código do projeto. Conforme exemplo do template-projeto-integrador. ESTE EXERCÍCIO É INDIVIDUAL.
A entrega deve incluir as seguintes etapas:
Etapa | Critério | Descrição | Pontos |
---|---|---|---|
1 | Exploração dos Dados | Análise inicial do conjunto de dados - com explicação sobre a natureza dos dados -, incluindo visualizações e estatísticas descritivas. | 10 |
2 | Aplicação das Técnicas | Implementação dos algoritmos KNN e K-Means para treinar modelos de classificação. | 10 |
3 | Matrizes de Confusão | Geração de matrizes de confusão para cada modelo. | 20 |
4 | Avaliação dos Modelos | Utilização de métricas como acurácia, precisão, recall e F1-score para avaliar o desempenho dos modelos. | 20 |
5 | Comparação dos Resultados | Comparação e tabulação dos resultados obtidos pelos dois algoritmos, discutindo suas vantagens e desvantagens. | 20 |
6 | Documentação | Relatório detalhado do processo, incluindo código comentado, visualizações e conclusões. | 20 |