• Esta atividade deve ser realizada individualmente
Caso necessário faça a instalação das seguintes bibliotecas
pip install numpy
pip install pandas
pip install matplotlib
pip install scipy
-
Visite algum repositório e escolha um conjunto de dados de seu interesse. Recomenda-se criar um perfil no Kaggle e utilizar os datasets disponíveis - Kaggle
-
Faça uma descrição do conjunto de dados escolhido. Indique os seguintes pontos:
- Origem
- Nome
- Tamanho
- Quantidade de Registros
- Linhas x Colunas
- Dados Faltantes
-
Utilize funções estatísticas para descrever as variáveis númericas de seu conjunto de dados.
- Média
- Mediana
- Variância
- Desvio Padrão
-
Utilize as bibliotecas Matplotlib e Seaborn para criar visualizações das análises realizadas.
- Histograma
- Scatter plot
• Esta atividade é baseada no conteúdo de estatítista, manipulação de arquivos e visualização de dados.
Para entregar este projeto
Para entrega, o aluno deverá elaborar um único relatório (Jupyter Notebook) com os resultados das atividades solicitadas.
A entrega deve ser realizada pelo Teams da disciplina em um único arquivo no formato .ipynb identificado como como “RM_NOME_202302_CP1.ipynb”, onde “NOME” e "RM" devem ser substituídos pelos dados do aluno que elaborou o arquivo.
• As análises devem conter o código utilizado e suas respectivas considerações utilizando Markdown para explicar a análise da função e do gráfico plotado.
Para contato, envie e-mail para [email protected] ou me procure pelo Teams.