Giter VIP home page Giter VIP logo

opendata_bolsafamilia's Introduction

Dados Abertos - Bolsa Família

Projeto que coleta dados abertos sobre o bolsa família e realiza CRUD e algumas outras operações sobre os dados de um determinado mês/ano.

Ferramentas utilizadas

  • Python 3
  • Virtualenv
  • Pip
  • Flask
  • Bash Script
  • SQLite 3
  • MySQL Workbench

Features:

  • ETL dos dados CSV para DB,
  • DER,
  • MR,
  • Queries,
  • View,
  • "Procedure",
  • Trigger,
  • Camada de Apresentação,
  • Camada de Persistência.

Dados utilizados

  • Bolsa Família : Pagamentos

Dados de pagamentos da despesa do programa social "Bolsa Família" da data de Setembro/2015.

O arquivo csv dos dados abertos pode ser encontrado neste link.

  • Despesas : Classificação Funcional da Despesa (MTO)

Informações, em formato aberto, da classificação funcional da Despesa, publicada no Manual Técnico de Orçamento, pelo Ministério do Planejamento, do ano de 2015.

O arquivo csv dos dados abertos pode ser encontrado neste link.

Importar Dados (CSV)

O script import.sh executa o script pre_import.sh e o arquivos py import_bf_csv.py de acordo com a necessidade.

O script pre_import.sh trata os arquivos csvs da seguinte forma:

  • Renomeia os arquivos extraídos para o nome utilizado no arquivo py
  • Elimina os headers dos csvs
  • Inclui headers corretos nos csvs

O programa import_bf_csv.py irá importar os dados contidos no arquivo bf.csv e func_2015.csv usando o SQLite3 criando um arquivo do tipo db para manipular os dados importados. Ele também cria as tabelas primárias para importar os dados do CSV e também as tabelas normalizadas a nível 3F.

AVISO: A execução a seguir pode levar um tempo, pois irá processar aproximadamente 2gb de dados.

Passos a executar:

  1. Download do arquivo csv do bolsa família de 09/2015 e funções de 2015;
  2. Colocar na pasta raiz;
  3. Extrair os arquivos;
  4. Executar o script import.sh para tratar os arquivos csvs e importar os csvs para os dbs.

Executando o script import.sh:

$ bash import.sh

Obs.: Os arquivos csv e db são muito extensos para incluí-los em um repositório Git, logo, deixe estes arquivos locais em sua máquina. O arquivo csv é baixado e o arquivo db é gerado. Obs.2: O arquivo de .db deve permanecer na pasta bf/.

Checar BD

O comando a seguir imprime em terminal todos os dados que estavam contidos no arquivo csv.

$ sqlite3 bf.db 'select * from BOLSA_FAMILIA'
$ sqlite3 bf.db 'select * from FUNCAO_SUBFUNCAO'

Tabelas 3F

Na pasta MR temos o diagrama, modelo e script SQL das tabelas normalizadas na forma 3F geradas a partir do MySQL Workbench, para verificar o esquema das tabelas é só utilizar o SQLite3 executando os seguintes comandos:

$ cd MR
$ sqlite3
$ sqlite> .read EER.sql

Para inserir os dados abertos nas tabelas normalizadas em 3F é só executar o script SQL normalize.sql:

$ sqlite3 bf.db < normalize.sql

Para inserir as views.sql e os triggers.sql no banco de dados, executar os seguintes comandos:

$ sqlite3 bf.db < views.sql
$ sqlite3 bf.db < triggers.sql

Web Service

Utilizando o Python 3 e o framework web Flask foram implementadas camadas de persistência e apresentação para possibilitar o CRUD do sistema e as consultas no banco de dados.

  • Criar environment do sistema:
$ virtualenv env
  • Para instalar o Flask e continuar a desenvolver:
$ . env/bin/activate
$ export BF_SETTINGS=config.py
$ pip install --editable .
$ export FLASK_APP=bf
  • Para iniciar o Web Service:
$ flask run

A aplicação estará ativa no endereço http://localhost:5000/ .

  • Para sair do environment:
$ deactivate

Relatório

Na pasta doc contém o relatório do projeto com o passo a passo de desenvolvimento, desde a análise de cada campo nas tabelas até o desenvolvimento da camada de apresentação dos dados.

Motivação

Projeto final da matéria de Banco de Dados, professora Maristela. Universidade de Brasília (UnB), 2016/2.

Autoria

Dayanne Fernandes da Cunha - 13/0107191
Christian Costa Werner - 14/0134573

opendata_bolsafamilia's People

Contributors

dayof avatar chriscwerner avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.