Giter VIP home page Giter VIP logo

covid-19-puerto-rico's Introduction

Datos y análisis del COVID-19 en Puerto Rico

Este proyecto recopila datos sobre COVID-19 publicados por el Departamento de Salud de Puerto Rico en un formato legible por computadora, y contiene algunos análisis de estos.

Visita el dashboard en:

Datos de fuente y archivos CSV

Los datos provienen principalmente de:

  1. Los informes de Casos Positivos COVID-19 del Departamento de Salud de Puerto Rico;
  2. Descargas diarias del API del Bioportal del Departamento de Salud de Puerto Rico;
  3. El COVID Tracking Project (datos de hospitalizaciones), que a su vez los obtiene del Departamento de Salud de Puerto Rico;
  4. Fuentes misceláneas como reportes de prensa o informes y gráficas del Departamento de Salud de Puerto Rico que no aparecen en esos enlaces pero que se han compartido con periodistas.

En el directorio assets/source_material/ se recopilan imágenes de boletines y gráficas, según este esquema:

Una selección de datos de estos se ha copiado a mano a los archivos CSV en el subdirectorio assets/data/, que incluyen:

  • PuertoRico-bulletin.csv, que consiste de números de "anuncio" que se hacen todos los días. Estas son las cifras que más publicidad reciben.
  • PuertoRico-bitemporal.csv, que consiste de datos de gráficas que acompañan estos boletines y que atribuyen las muertes a la fecha en que en verdad sucedieron y los casos positivos a la fecha que se tomó la muestra.

Los datos de pruebas vienen de un conjunto de descargas diarias que realizo del Bioportal del Departamento de Salud de Puerto Rico. Todas estas descargas no se comparten aquí pero las guardo en la nube de Amazon (AWS S3) y podrían compartirse con quien tenga un interés serio. También todo el código chapucero que uso para descargar esos datos y analizarlos está en este repositorio, así que quien tenga el conocimiento técnico y se pueda tapar un poco la nariz podría servirse.

Esquema bitemporal

Esta colección de datos se ha enfocado en presentar los datos de los gráficos en un llamado esquema bitemporal, donde se clasifica cada punto por dos fechas:

  • La fecha de publicación de la cifra (columna bulletin_date);
  • La fecha del evento que la cifra pretende describir (columna datum_date).

La intención de esto es posibilitar análisis de, por ejemplo:

  • Cuándo es que de verdad se realizaron las pruebas o se murieron las personas vs. cuándo lo anunció Salud;
  • Velar si hay problemas de calidad de datos, por ejemplo si casos que aparecen en boletines más tempranos desaparecen de boletines más tardíos (¡que sí ocurre!).

Por ejemplo, esta gráfica de casos positivos probables hasta el 2 de mayo del 2020 da 9 casos probables para el 1ero de abril:

Casos probables hasta 2 de mayo

Pero la gráfica del boletín del próximo día (datos hasta 3 de mayo del 2020) da 8 casos probablespara la misma fecha de 1ero de abril:

Casos probables hasta 3 de mayo

Así que el archivo bitemporal reporta:

bulletin_date,datum_date,confirmed_and_probable_cases,confirmed_cases,probable_cases,deaths
2020-05-02,2020-04-01,80,71,9,3
2020-05-03,2020-04-01,79,71,8,3

De nuevo, esta recopilación de datos intenta facilitar tales observaciones.

Información técnica

Si se diera el triste caso que a este autor se lo llevaran arrestado o lo atropellara un tren, o que algún loquitx quisiera reproducir estas páginas, hay instrucciones bien malas aquí.

Agradecimientos

A Robby Cortés (@RobbyCortes en Twitter) y Angélica Serrano-Román (@angelicaserran0) que diligentemente publican los boletines del Departamento de Salud todas las mañanas.

A Danilo Pérez por muchas sugerencias valiosas.

Al Fideicomiso de Salud de Puerto Rico y al Prof. Rafael Irizarry por facilitar datos sobre pruebas moleculares en Puerto Rico.

covid-19-puerto-rico's People

Contributors

sacundim avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.