observatorio-jats

O Journal Article Tag Suite (JATS) é um formato XML usado para formatar e descrever a estrutura interna de conteúdos digitais da literatura científica. É o padrão técnico (formalmente NISO-ANSI Z39.96-2012) mais utilizado por periódicos científicos. Não é apenas um padrão para mostrar ou editar o conteúdo, como PDF, HTML, DOC, etc. É um padrão para dar significado às partes do conteúdo, e para indicar com todos os detalhes e de forma padronizada, os metadados da publicação e da proveniência de dados e da autoria.

São ~4 milhões de artigos JATS no PubMed Central, ~0,5 milhões no SciELO, mais alguns milhões dispersos em diversos outros repositórios JATS.

... É tanto JATS, e ninguém olha para eles como "mina de ouro" de conhecimento estruturado, ao menos no Brasil: a iniciativa do Observatório JATS nasceu para isso, para explorarmos mais essa imensa base de dados científicos, certificados, bem organizados, com estrutura e semântica bem definidas.

É um observatório de fato, pois há um "universo" que não damos conta de conhecer, dada a quantidade imensa de arquivos JATS e de detalhes contidos neles; mas podemos escolher um "alvo", e nos pormos a observar o que existe naquela região do "espaço JATS"... E para observar precisamos de ferramentas e pessoas operando essas ferramentas, constituindo assim um observatório.

Os alvos são assuntos ou perguntas viáveis do ponto de vista estatístico. Assim como num grande observatório astronômico, mantido por uma comunidade, o sucesso de suas observações depende do sucesso e alinhamento entre duas sub-comunidades: o grupo que formula as perguntas e dá significado às observações dentro de suas teorias, e o grupo que põe a mão na massa, sabe operar o equipamento, e realiza ou auxilia nas campanhas observacionais.

Junte-se ao Observatório JATS: juntando-se a uma curadoria, o grupo que faz perguntas dentro do seu escopo de interesse; ou juntando-se aos experts em buscas, estatísticas e JATS, que operam o observatório.

Mantenedores

A comunidade mantenedora deste projeto é formada por dois grupos, a exemplo dos grupos QueriDO:

curadorias: definem os "alvos", estabelecem para quais assuntos e artigos (documentos JATS) desejam voltar seus olhares, fazer suas explorações, e mais tarde entregar seus relatórios e pareceres.
PS: não há restrição à participação em mais de uma curadoria.
experts: entusiastas da Ciência Aberta, Estatística, programação, web semântica ou data scraping, ajudando a curadoria a achar a "agulha no palheiro", e preparar milhares de artigos JATS para constituir um corpus textual de análise: bem estruturado e suficientemente completo para cada alvo definido pelas curadoriais.
PS: um expert pode também ser membro de uma curadoria.

Campanhas observacionais

Olhar para uma imensa massa de artigos científicos, todos dispostos em JATS, requer alguns cuidados e metodologia. Nosso principal referencial metodológico são as revisões sistemáticas, a análise estatística, e as técnicas e tecnologias de bancos de dados (incluindo desde o SQL à Web Semântica).

Há naturalmente um funil de busca com criteriosa seleção, que envolve o trabalho e discussão entre todos, da curadoria e do grupo de experts. A exigência que prevalece é que sejam sempre realizadas ações de forma não tendenciosa.

Etapas

Formação e homologação da curadoria (aprovação de alvo e dos compromissos da equipe);
Planejamento da campanha observacional, e alinhamentos com a equipe de experts (aprovação de calendários e responsabilidades);
Experimentos-piloto e provas de conceito;
Realização da campanha: fica regisrada como relatório de apresentação (exemplos: c01-consistencia, c05-openCoherence-zika) e relatórios de resultados.
Revisão final;
Revisão e divulgação dos relatórios.

Todos os materiais ficam registrados na pasta das campanhas.

Relatórios

Os resultados das campanhas observacionais ficam registrados em relatórios. Exemplos: c01-consistencia/report-01.md, c05-openCoherence-zika/report-01.md, c05-openCoherence-zika/report-02.md.

Documentação

Tutoriais:
- Tutorial do curador
- Tutorial do expert
Instruçoes para instalação
Aquitetura e ferramentas.
...
OpenCon2017 subsidios oficina.

Organizações que apoiam este projeto

FioCruz / CIDACS: Centro de Integração de Dados de Conhecimentos para Saúde
http://www.cidacs.bahia.fiocruz.br/
Ver também observatorio.fiocruz.br e filminho de apresentação.
OKBr: Open Knowledge do Brasil, através do @ppkrauss
http://ok.org.br
https://discuss.ok.org.br/5844
UnB: através dos professores Jorge H. C. Fernandes e Ricardo B. Sampaio.
http://www.unb.br

unb-cidacs / observatorio-jats Goto Github PK