Este projeto foi desenvolvido em grupo como requisito para conclusão do módulo XI do curso de Data Science - Santander Coders 2022.
O objetivo do presente projeto foi desenvolver um modelo de Machine Learning e análises exploratórias em um dataset escolhido pela equipe.
Para tal, foi escolhido o dataset sobre Churn Customers em:
O modelo foi criado para predição de 'Churn'de clientes de uma empresa X, seguindo os passos:
-
Análise de distribuição das variáveis;
-
Análise de correlação entre variáveis e 'target';
-
Observação de diferenças de padrões entre clientes com e sem 'Churn';
-
Preprocessamento do dataset com 'scaler' e 'encoder';
-
Uso de PCA para redução de dimensionalidade do Dataset;
-
Testes de 3 modelos de classificação diferentes (2 vistos no curso e Regressão Logística, de menos complexidade);
-
Visualização de métricas e learning curve para os 3 modelos testados.