Giter VIP home page Giter VIP logo

es-covid19-br's Introduction

es-covid19-br

Empacota os dados de turicas/covid19-br em uma instância Kibana/Elasticsearch, facilitando acesso e consulta.

Licenças

Os scripts neste repositório se encontram sob Apache License v2.0, mas os dados carregados são distribuídos pela licensa descrita em turicas/covid19-br.

Caso inclua visualizações que usam estes dados em algum projeto, atente para as condições de uso e distribuição destes dados.

Dependências

Você irá precisar de:

Nota: se você já fez o clone antes de adicionar suporte a lfs, após haver adicionado o suporte você pode:

$ rm snapshots.tgz
$ git checkout .

Para baixar os arquivos que necessitam do lfs.

Com as dependências resolvidas:

$ make setup

Isto deve dar conta de instalar todas as ferramentas adicionais necessárias, e baixar os dados a partir dos datasets.

Este projeto foi apenas testado em Linux, e precisa de uma configuração de sistema para que o Elasticsearch rode corretamente sobre Docker. Esta config talvez não seja necessária para outros ambientes, mas é preciso testar e adequar o Makefile para que funcionem neles.

Usando

Após o setup inicial, você pode:

$ make run

Serão inicializados containeres Elasticsearch e Kibana, sendo os dados populados em índices do Elasticsearch via Logstash logo em seguida.

Terminada a inclusão dos dados no Elasticsearch, você pode importar alguns dashboards, visualizações e queries que vêm junto com o repositório com:

$ make import-kibana

E, finalmente, acessar o Kibana: http://localhost:5601.

Caso não tenha familiaridade no uso do Kibana, você pode consultar a documentação da Elastic, incluída na seção de Referências, abaixo.

Atualizando os dados

Caso você queira atualizar os dados com a ultima versão disponível, você poderia executar:

$ make update-data

Mas note que isto irá também resetar as configurações de objetos salvos no Kibana, ou seja, dashboards, queries, visualizações, etc.

Para que você não perca seus dashboards e queries, você pode rodar a seguinte seqüência de targets:

$ make export-kibana
$ make update-data
$ make import-kibana

Recarregue o Kibana, caso o tenha aberto no browser (full reload), para que as alterações façam efeito.

Configurando

A ingestão dos dados é feita no Elasticsearch em um índice por arquivo .csv gerado pelo projeto de coleta (covid19-br). Para um dado arquivo nome.csv é criado um índice chamado nome no Elasticsearch. Para que as queries e dashboards funcionem bem, é preciso prover mappings para que os dados sejam interpretados corretamente pelo Elasticsearch. Um mapping de exemplo para o arquivo/índice de casos (caso.csv/caso) é incluído no diretório elasticsearch/index-templates, com o nome caso.json. Outros templates com os mappings necessários podem ser incluídos neste diretório, seguindo a convenção nome.json, onde nome é o nome do índice/arquivo .csv.

Pode ser também necessária a customização do pipeline ou dos filtros usados pelo logstash usado na ingestão dos dados. Esta configuração se encontra no arquivo logstash/logstash.conf

Contribuindo

Contribuições de código podem ser feitas via PR normalmente.

Caso deseje incluir ou modificar algum dashboard, query, visualização ou qualquer dado relacionado ao Kibana, localize ou crie um diretório adequado para sua alteração no diretório kibana/saved-objects. Exporte os objetos relevantes do Kibana para a sua alteração, neste diretório, faça um commit com eles e envie um PR.

No PR, descreva a motivação e a alteração na maior quantidade de detalhes possível.

Você pode querer revisar as Issues abertas.

Referências

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.