Giter VIP home page Giter VIP logo

covid19-bigdata's Introduction

covid19-bigdata

Desarrollado por: Santiago Arturo Zapata Chacón

En este proyecto se aplicó lo aprendido en el curso Tópicos especiales de Telemática acerca del tema bigdata sobre los datos de covid19 a nivel mundial y nacional.

Puede ver el desarrollo del análisis en el siguiente enlace: notebook

Se utilizo la herramienta de Google Colaboratory para realizar el notebook dónde se realizaron las siguientes fases:

  • Fuentes de datos
  • Ingesta y almacenamiento de datos
  • Procesamiento: Análisis exploratorio con Spark
  • Visualización básica de datos

Primero se importó lo necesario para realizar las fases anteriores:

Fuente de datos

Nivel mundial (Confirmed, deaths, recovered): https://data.humdata.org/dataset/novel-coronavirus-2019-ncov-cases Nivel Colombia: https://www.datos.gov.co/Salud-y-Protecci-n-Social/Casos-positivos-de-COVID-19-en-Colombia/gt2j-8ykr/data

Ingesta y Almacenamiento de datos

Se subió los datasets a este repositorio datasets. Luego en el notebook se descargan y se cargan con spark.

Procesamiento: Análisis exploratorio de datos con pyspark

En la sección de Procesamiento: Análisis exploratorio de datos con pyspark del notebook se realiza ese primer vistazo a como los datos de los diferentes datasets están constituidos. Además, se realizan algunas consultas para responder preguntas especificas.

Visualización básica de datos

En la sección de visualización básica de datos del notebook podemos observar los diferentes gráficos que responden preguntas especificas tanto a nivel mundial, nacional y Mundo vs Colombia. Se utilizó la libreria de Matploblib para realizar dichos gráficos.

covid19-bigdata's People

Contributors

sazapatac1 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.