Este projeto foi desenvolvido em grupo como requisito para conclusão do módulo XII do curso de Data Science - Santander Coders 2022.
O objetivo do presente projeto foi desenvolver um modelo de Machine Learning e análises exploratórias em um dataset escolhido pela equipe.
Para tal, foi escolhido o dataset de músicas do Spotify encontrado em:
O modelo foi criado para predição de Aprovação de Crédito, seguindo os passos:
-
Análise de distribuição das variáveis;
-
Análise de correlação entre variáveis e 'target';
-
Observação de diferenças de padrões entre Aprovados e Não Aprovados;
-
Preprocessamento do dataset com 'scaler' e 'encoder';
-
Seleção de Features;
-
Uso de PCA para redução de dimensionalidade do Dataset;
-
Testes de 3 modelos de classificação diferentes (Regressão Logística, RandomForestClassifier e XGBoostClassifier);
-
Visualização de métricas;
-
Tunning de hiperparâmetros para o modelo com melhor performance;
-
Visualização de explicabilidade do modelo escolhido.