- Informações complementares: A atividade é composta por 5 questões dissertativas. Os resultados são utilizados para divisão de grupos da atividade 04;
- AO CONCLUIR A ATIVIDADE: ENVIAR APENAS O LINK DO REPOSITÓRIO GITHUB (ESPECIFICAR A BRANCH) PÚBLICO.
-
Explique, com suas palavras, o que é machine learning?
Machine Learning(ML) é uma subárea da Artificial intelligence (AI), utiliza a estatística para, a partir de dados conhecidos, podermos prever as respostas de dados novos.
-
Explique o conceito de conjunto de treinamento, conjunto de validação e conjunto de teste em machine learning.
- Conjunto de treinamento: usado para treinar o modelo;
- Conjunto de validação: usado para comparar os vários métodos utilizados para treinar o modelo, alterando os parâmetros para avaliar qual é o mais adequado;
- Conjunto de teste: usado para avaliar o desempenho final e estimar a capacidade de generalização do modelo, normalmente são dados que não estavam no conjunto de treinamento e validação.
-
Explique como você lidaria com dados ausentes em um conjunto de dados de treinamento.
Para tratar os dados ausentes, podemos utilzar os seguintes procedimentos:
- Substituir de valores ausentes pela média, mediana, moda ou outro valor;
- Remover as linhas e colunas com dados ausentes;
- Inferir os dados com base em métodos estatísticos;
-
O que é uma matriz de confusão e como ela é usada para avaliar o desempenho de um modelo preditivo?
Usado para calcular a performance dos algoritmos de Machine Learning.
A performance é medida com os indicadores:
- Acurácia;
- Recall;
- Precisão;
- f-score;
- True Positive Rate (TPR);
- True Negative Rate (TNR);
- False Positive Rate (FPR);
- False Negative Rate (FNR);
-
Em quais áreas (tais como construção civil, agricultura, saúde, manufatura, entre outras) você acha mais interessante aplicar algoritmos de machine learning?
Gostaria de aplicar primeiramente na área da saúde e depois na manufatura.