Giter VIP home page Giter VIP logo

arpasicilia_od's Introduction

Intro

ARPA Sicilia, e in particolar modo il gruppo di lavoro di Giovanni Vacante, ha chiesto a Open Data Sicilia di costruire insieme una procedura e una modalità di pubblicazione dei i dati aperti sulle centraline dell'aria che gestisce.

ARPA pubblica già questi dati qui, ma ci sono delle piccole barriere di utilizzabilità che vanno eliminate.

Questo repository è stato creato per lavorare in gruppo.

arpasicilia_od's People

Contributors

aborruso avatar gpirrotta avatar patperu avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Forkers

gitter-badger

arpasicilia_od's Issues

E' normale che le stazioni espongano "inquinanti" diversi?

Ad esempio nella stazione "gabbia" ci sono SO2, NO2 e Benzene, mentre in quella "exautoparco" solo Benzene.

Se ARPA può scegliere l'ideale è che tutte le stazioni contengano lo stesso numero di inquinanti. Se invece le stazioni espongono dati diversi, abbiamo bisogno di un documento che ci indichi le differenze stazione per stazione.

Creare script che cancella le righe inutili di intestazione dei CSV

Ad esempio le prime 6 righe di:

"NetC";"ARPA Sicilia";;;;;;;
"Stat";"VILLA AUGUSTA";;;;;;;
"Parm";"Benzene";"Benzene";"Benzene";"Benzene";"Benzene";"Benzene";"Benzene";"Benzene"
"PtId";"3";"3";"3";"3";"3";"3";"3";"3"
"Unit";"ug/m3 293K";;;"ug/m3 293K";;"ug/m3 293K";"ug/m3 293K";
"Field";"Aver";"SWrd";"MinT";"Min";"MaxT";"Max";"Sigma";"Samp"
"05/09/2015 00:00";;;;;;;;
"05/09/2015 01:00";"0.25395812";"80000000";"01:00";"0.0";"00:02";"4.8326762";"0.9897983";"720"
"05/09/2015 02:00";"0.84494699";"80000000";"02:00";"0.0";"01:17";"1.98060547";"0.87410642";"720"
"05/09/2015 03:00";"1.37112855";"80000000";"02:01";"0.0";"02:16";"3.8027603";"1.52284766";"720"
"05/09/2015 04:00";"0.00121023";"80000000";"04:00";"0.0";"03:00";"0.1584486";"0.01057578";"720"
"05/09/2015 05:00";"0.58846163";"80000000";"05:00";"0.0";"04:30";"2.29750267";"0.98001374";"720"
"05/09/2015 06:00";"0.82305098";"80000000";"06:00";"0.0";"05:59";"3.24819122";"1.39018815";"720"

Piccole novità sui dati ARPA

Scrivo anche qui un testo inviato in mailing list.

Vi scrivo per una piccola novità.

Da un po' di tempo il file opendata scaricabile in questa pagina (c'è il tasto in basso) è cambiato: infatti se scorrete sulla destra, trovate un po' tutti i dati in formato grezzo.

E' una sorta di xls che contiene dentro un csv. L'URL è http://88.53.168.210/Bollettino2/MAria_report.xls, ma purtroppo nelle ultime settimana non è quasi mai raggiungibile.
Una copia non aggiornatissima la potete scaricare da qui.

Si presenta più o meno così:

Non è adatto a farci subito delle elaborazioni: ci sono intestazioni da rimuovere, colonne totalmente vuote e/o inutili, nomi di colonna da normalizzare, ecc..

Però è un file che si presta a essere modificato e "ricostruito". Ho creato uno script in bash che consente di avere come output un file csv che può essere usato per analisi, grafici e mappe.
Questo file csv di output non è ancora la fine del mondo, così come non lo è lo script, ma consente di avere un file pronto per ulteriori elaborazioni.

L'output attuale dello script è questo, mentre lo script è questo.

Il file originario presenta due righe di intestazione:

  • una con nome stazione, inquinante e unità di misura (ad esempio "partinico SO2(µg/m3)-2014");
  • una con il tipo di misura in elenco (ad esempio "Max orario").

Ho ridotto tutto a una sola intestazione con un nome di questo tipo "partinico_SO2_Max_orario".
In questo file trovate il passaggio dalle due intestazioni alla singola.

Lo script

E' basato su csvkit, agate e sulle classiche meravigliose utility di Linux.

Fa essenzialmente questo:

  • estrae soltanto le colonne che possono essere utili;
  • rimuove le righe di intestazione;
  • inserisce i nomi di colonna normalizzati;
  • verifica quali colonne sono vuote;
  • rimuove le colonne vuote.

Le stazioni

Non ho verificato, ma dovrebbero essere sempre quelle di questo elenco.

Futuro

Per il momento mi fermo qui, e lascio sopratutto a Patrick, Giovanni e Davide (che hanno lavorato sui primi dati ARPA) la palla.
Un grazie ad Antonio Conti di ARPA che mi ha dato informazioni utili sul file xls (ne è il creatore).

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.