Giter VIP home page Giter VIP logo

ssp's Introduction

Sémantický slovník pojmů

Sémantický slovník pojmů je nástrojem určeným pro popis otevřených datových sad publikovaných veřejnou správou ČR. Architektura slovníku je popsána v této koncepci.

Struktura

Hlavní části projektu jsou složky:

  • content - samotný obsah slovníku
  • docs - dokumentace
  • validation - SHACL validátor korektnosti slovníku, podpůrné skripty

Obsah slovníku se nachází ve složce 'slovník'. Ta obsahuje podsložky s jednotlivými slovníky ve formátu TTL, dle architektury popsané v Koncepci sémantického slovníku pojmů)

  • z-sgov - složka s aktuální verzí základního slovníku
  • v-sgov - složka s aktuální verzí slovníku veřejného sektoru
  • g-sgov - kořenová složka pro generické slovníky
  • l-sgov - kořenová složka pro legislativní slovníky
  • a-sgov - kořenová složka pro agendové slovníky
  • d-sgov - kořenová složka pro datové slovníky

Přístup k slovníku

Tento GIT repozitář je zdrojem pro následující aplikace nad slovníkem:

Tento repozitář vznikl v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0004172 a je udržován v rámci projektu OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983. Evropská unie - Evropský sociální fond - Operační program Zaměstnanost

ssp's People

Contributors

bindeali avatar blcham avatar dvdk01 avatar filip-kopecky avatar ir158 avatar jakubklimek avatar karelklima avatar ledsoft avatar martinnec avatar michalmed avatar mighantos avatar psiotwo avatar skodapetr avatar xzbozink avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

ssp's Issues

skos:broader použit i pro typeOf

Příklad:

a-sgov-104-pojem:má-datum-poslední-změny-agendy
        a                   <https://slovník.gov.cz/základní/pojem/typ-vlastnosti> , skos:Concept ;
        rdfs:label          "Má datum poslední změny agendy"@cs ;
        rdfs:subPropertyOf  <https://slovník.gov.cz/základní/pojem/vlastnost> ;
        skos:broader        <https://slovník.gov.cz/základní/pojem/vlastnost> , <https://slovník.gov.cz/základní/pojem/typ-vlastnosti> ;
        skos:inScheme       a-sgov-104:glosář .

Proč a-sgov-104-pojem:má-datum-poslední-změny-agendy skos:broader <https://slovník.gov.cz/základní/pojem/typ-vlastnosti>? Dává to smysl?

Chybný export vlastnosti "search index" s více hodnotami oddělenými čárkou

Více hodnot oddělených čárkou v "search index" se exportuje do jednoho řetězcového literálu.

Příklad:

s language tagy: L_SGOV_111_2009, typ vlastnost "Má kód agendy", "search index" : "kód agendy"@cs, "veřejný identifikátor agendy"@cs se exportuje do ""kód agendy", "veřejný identifikátor agendy""

bez language tagů: L_SGOV_111_2009, typ vlastnost "Má kód agendy", "search index" : "kód agendy", "veřejný identifikátor agendy" se exportuje do ""kód agendy", "veřejný identifikátor agendy""

Cyklus v importech slovníků Věci a Digitální objekty

"Věc" a "Digitální objekt" jsou definovány ve vlastních slovnících "Věci" a "Digitální objekty". Obe tyto oběkty na sebe ukazují a tedy plati:

g-sgov:věci/model   owl:imports    g-sgov:digitální-objekty/model  .
g-sgov:digitální-objekty/model   owl:imports    g-sgov:věci/model  .

Stejny cyklus tedy plati i mezi glosarmi.

Selection_257

Některé typy vlastností jsou v kompaktní reprezentaci typovány na owl:Class a owl:ObjectProperty a nemají rdfs:range

Příklad:

l-sgov-sbírka-111-2009-pojem:má-kód-agendy
        a                   skos:Concept , owl:Class , <https://slovník.gov.cz/základní/pojem/typ-vlastnosti> , owl:ObjectProperty ;
        rdfs:domain         l-sgov-sbírka-111-2009-pojem:agenda ;
        rdfs:label          "Má kód agendy"@cs ;
        rdfs:subPropertyOf  <https://slovník.gov.cz/základní/pojem/vlastnost> ;
        <http://purl.org/dc/elements/1.1/relation>
                "https://esbirka.opendata.cz/zdroj/předpis/111/2009/sekce/13" ;
        skos:broader        <https://slovník.gov.cz/základní/pojem/typ-vlastnosti> , <https://slovník.gov.cz/základní/pojem/vlastnost> ;
        skos:inScheme       l-sgov-sbírka-111-2009:glosář .

Typovat typ vlastnosti na owl:Class a owl:ObjectProperty je divné. Mělo by to být typováno na owl:DatatypeProperty a definovat rdfs:range na rdfs:Literal (mluvíme o kompaktní reprezentaci).

Odstranit prázdné přílohy a špatné reference na přilohy

Vytvořeno @karelklima:
Některé přílohy na GitHubu v SSP repozitáři jsou prázdné, vzhledem k mnoha změnám je možné, že je tam podobných problémů víc.

Je potřeba:

  1. Smazat prázdné přílohy
  2. Smazat linky ze slovníků na prázdné přílohy
  3. Smazat linky ze slovníků na neexistující přílohy

Pravnická osoba nemá nadtřídu se stereotypem Kind

Motivace: Potřebuji vědět, že právnicka osoba a fyzická osoba má různy princip identity abychom mohli poskytnout validaci OFN. Příklad z turistického cíle (Fyzicka osoba dedí od kindu Člověk, no Osoba takovou nadtřídu nemá):

image

Revize základního slovníku

  • sjednotit glosáře kompaktní a full verze základního slovníku
  • aktualizovat model základního slovníku dle OntoUML 2.0
  • aktualizovat koncepci SSP

Model orgánů

Tato issue reaguje na pozn. v modelu: "Bylo by dobré rozbít relační strukturu a namodelovat data pořádně, udělat speciální modely např. pro orgán Poslanecká sněmovna apod."

Čistě z teoretického pohledu by to bylo fajn. Jako orgán jsou totiž v tabulce orgánů reprezentovány různé typy entit od sněmovních výborů v jednotlivých obdobích, přes funkční období sněmovny, přes různé vlády ČR, kraje až po cizí státy. Jediná šance je přes typy orgánů, což je číselník, který nám definuje specializace obecného typu objektu Orgán. Čili odstranit typ vztahu Má typ orgánu a typy orgánů modelovat jako specializace typu objektu Orgán.

Vytvořit "pojmenovaný prvek" ve V-SGoV

Napříč různými use cases se objevuje potřeba specializovat typ prvků, který zavádí obecné vlastnosti pro pojmenování a popis prvků. Čili je nutno ve V-SGoV zavést "pojmenovaný prvek".

Kardinality u Má obecný typ orgánu a Má nadřazený typ orgánu

Kardinality říkají, že typ orgánu má max 1 nadřazený a max 1 obecný typ orgánu, což je OK. Obráceně ale říkají, že typ orgánu má max 1 podřazený a max pro 1 je obecným typem, což asi není OK. Podle mého názoru tam má být v obráceném směru 0..*.

Podobná situace je také u Má nadřazený orgán, Má typ orgánu (současná podoba kardinalit specifikuje, že daného typu může mít max 1 orgán).

Refactor Z-SGoV to support quales

As a SSP user
I want to be able to express quality values
in order to represent instance data in SSP compliant format (e.g. for form instance data representation)

A/C:

  • refactor Z-SGoV to full/compact parts
  • create representation of quales in Z-SGoV full

V-SGoV Křestní jméno

Pojem "Křestní jméno" je archaický, současná legislativa jej nezná. Vhodnější pojem pro jméno fyzické osoby je pouze "Jméno"

A_PSP Má obecný typ funkce špatně namodelován

"Má obecný typ funkce" v A_PSP je intrinsic trope type. Nemá být relator? Prvním účastníkem by byl Typ funkce, druhým Obecný typ funkce.

Dále je uvedeno, že specializuje rdfs:label, což je divné. Hodnota té vlastnosti "Má obecný typ funkce" je číselný kód, takže to asi nebude label ne?

Zrevidovat G-SGoVy pro OFN

Cílem je zrevidovat aktuální G-SGoVy pro OFN:

Následující G-SGoVy se stanou samostatnými D-SGoVy, pro příslušné datové sady

  • Registr práv a povinností
  • Aktuality
  • Sportoviště
  • Turistické cíle
  • Události
  • Rozhraní katalogů otevřených dat

Následující G-SGoV jsou obecné a budou rozmodelovány do Z-SGoV, V-SGoV, případně ponechány jako G-SGoV (extendující V-SGoV):

  • Základní datové typy - Z-SGoV (Ano či ne (booleovská hodnota), Celé číslo, Desetinné číslo, Datum, Čas, Datum a čas, Řetězec, URL, Množství), G-SGoV (Cena)
  • Věc - Z-SGoV (Definuje identifikátor, název, popis, čas zneplatnění apod.)
  • Adresy - zůstane samostatný G-SGoV
  • Bezbariérovost -
  • Časová specifikace - Z-SGoV
  • Digitální objekty - V-SGoV
  • Kontakty - V-SGoV
  • Lidé a osoby - Fyzické a právnické osoby - V-SGoV
  • Umístění - Z-SGoV
  • Vstupné - V-SGoV
  • Číselníky - V-SGoV
  • Prostorová data - samostatný G-SGoV rozšiřující V-SGoV

U těchto OFN, zatím nevím, co s nimi:

  • Propojená data (Linked Data)
  • Propojená data s časovou složkou
  • Technické standardy pro datové sady na stupni otevřenosti 3

Typy vlastností v kompaktní reprezentaci nejsou typovány na owl:DatatypeProperty

Příklad:

a-sgov-104-pojem:má-datum-poslední-změny-agendy
        a                   <https://slovník.gov.cz/základní/pojem/typ-vlastnosti> , skos:Concept ;
        rdfs:label          "Má datum poslední změny agendy"@cs ;
        rdfs:subPropertyOf  <https://slovník.gov.cz/základní/pojem/vlastnost> ;
        skos:broader        <https://slovník.gov.cz/základní/pojem/vlastnost> , <https://slovník.gov.cz/základní/pojem/typ-vlastnosti> ;
        skos:inScheme       a-sgov-104:glosář .

Neměly by být typovány na owl:DatatypeProperty? Typy vztahů jsou typovány na owl:ObjectProperty

V-SGoV Jméno právnické osoby

Jako vhodnější pojem pro jméno právnické osoby se mi jeví "Název", viz např. § 132 zákona č. 89/2012 Sb. občanský zákoník (nový)

Má obecný typ funkce jako typ vztahu místo typ vlastnosti

Má obecný typ orgánu je modelován jako typ binární vztahu, v němž z obou stran participuje Typ orgánu. Navrhuji modelovat Má obecný typ funkce stejně, tj. jako typ vztahu, v němž z obou stran participuje Typ funkce. Já myslím, že sémanticky to tak v PSP i mysleli, jen si usnadnili práci a udělali to tak, že obecné typy funkcí zakódovali do hodnot místo do řádků v tabulce typ_funkce.

V RDF datech pak můžeme přidělat 3 specifické typy funkcí pro tyto obecné typy funkcí.

Vytvořit automatické testy pro validování slovníků

V současné době je možné do repozitáře commitovat libovolné slovníky a glosáře. Je třeba zajistit, aby:

  • každý PR byl zrevidován
  • nebylo možné mergnout nevalidní slovník. Validační pravidla budou součástí dalších tasků, prozatím stačí ukázková pravidla nad SKOS glosářem.

Chybí vztah mezi typem funkce a typem orgánu

Podle dokumentace otevřených dat PSP ČR http://www.psp.cz/sqw/hp.sqw?k=1301, přesněji podle dokumentace tabulky typ_funkce, je typ funkce navázán na typ orgánu. K tabulce typ_funkce je uvedeno, že "Tabulka definuje typ funkce v orgánu - pro každý typ orgánu jsou definovány typy funkcí.".

Vazba mezi typem funkce a typem orgánu ale v modelu chybí, takže je nutno ji dodělat.

Zastaralé data o relátore v-sgov:má-administrativní-platnost-položky

v-sgov-pojem:časový-prvek neni pojmem V-SGOV slovniku. Verim, ze byl nahrazen z-sgov-pojem:časový-prvek, bohuzel reference na tento pojem v slovniku V-SGOV zustali.

Pripad 1:

Relator v-sgov-pojem:má-administrativní-platnost-položky ukazuje zaroven na v-sgov-pojem:časový-prvek a z-sgov-pojem:časový-prvek.
Relevantni cast kodu:

v-sgov-pojem:má-administrativní-platnost-položky
        a                z-sgov-pojem:typ-vztahu , skos:Concept ;
        rdfs:subClassOf  [ a                   owl:Restriction ;
                           owl:onProperty      z-sgov-pojem:má-vztažený-prvek-2 ;
                           owl:someValuesFrom  v-sgov-pojem:časový-prvek
                         ] ;
        rdfs:subClassOf  [ a                  owl:Restriction ;
                           owl:allValuesFrom  z-sgov-pojem:časový-prvek ;
                           owl:onProperty     z-sgov-pojem:má-vztažený-prvek-2
                         ] ;
        rdfs:subClassOf  [ a                   owl:Restriction ;
                           owl:onProperty      z-sgov-pojem:má-vztažený-prvek-1 ;
                           owl:someValuesFrom  v-sgov-pojem:položka
                         ] ;
        rdfs:subClassOf  [ a                  owl:Restriction ;
                           owl:allValuesFrom  v-sgov-pojem:časový-prvek ;
                           owl:onProperty     z-sgov-pojem:má-vztažený-prvek-2
                         ] ;
        rdfs:subClassOf  [ a                   owl:Restriction ;
                           owl:onProperty      z-sgov-pojem:má-vztažený-prvek-2 ;
                           owl:someValuesFrom  z-sgov-pojem:časový-prvek
                         ] ;
        rdfs:subClassOf  [ a                  owl:Restriction ;
                           owl:allValuesFrom  v-sgov-pojem:položka ;
                           owl:onProperty     z-sgov-pojem:má-vztažený-prvek-1
                         ] ;

Navrhuji zrusit obsolete triply:

v-sgov-pojem:má-administrativní-platnost-položky
        rdfs:subClassOf  [ a                   owl:Restriction ;
                           owl:onProperty      z-sgov-pojem:má-vztažený-prvek-2 ;
                           owl:someValuesFrom  v-sgov-pojem:časový-prvek
                         ] ;
        rdfs:subClassOf  [ a                  owl:Restriction ;
                           owl:allValuesFrom  v-sgov-pojem:časový-prvek ;
                           owl:onProperty     z-sgov-pojem:má-vztažený-prvek-2
                         ] ;

Pripad 2:

v-sgov-pojem:má-platnost pouziva v-sgov-pojem:časový-prvek misto z-sgov-pojem:časový-prvek.

Relayout SSP repository structure

Current structure is not suitable for publishing glossary/model/vocabulary artifacts to the Virtuoso server.

The new structure is as follows:

  1. Directory per vocabulary:
    z-sgov
    v-sgov
    o-sgov-<DOMENA>, where <DOMENA> is the domain of the generic vocabulary, e.g. silniční-doprava (road traffic)
    l-sgov-sbírka-<C>-<R>, where <C>-<R> is the law identification in the Czech republic, e.g. 111-2009
    a-sgov-<A>, where <A> is the agenda number, e.g. 101
    d-sgov-<D>, where <D> is the identifier of a dataset/interface/application

  2. Each directory one or more files of the form:

<SLOVNIK>-glosář(-<SPECIFICKY-IDENTIFIKATOR>).ttl
<SLOVNIK>-model(-<SPECIFICKY-IDENTIFIKATOR>).ttl
<SLOVNIK>-slovník(-<SPECIFICKY-IDENTIFIKATOR>).ttl

where <SLOVNIK> is the vocabulary identifier, e.g. l-sgov-sbírka-111-2009 and <SPECIFICKY-IDENTIFIKATOR> is any identifier distinguishing vocabulary parts (e.g. per users who created them).

Optionally also the directory contains files of the following form
<SLOVNIK>-mapování(-<SPECIFICKY-IDENTIFIKATOR>).ttl
<SLOVNIK>-diagram(-<SPECIFICKY-IDENTIFIKATOR>).ttl

  1. All files of the same type (e.g. glosář) in the directory link to the same RDF resource, e.g.

l-sgov-sbírka-111-2009-glosář-MaNe.ttl
l-sgov-sbírka-111-2009-glosář-PeKr.ttl

both link to the following RDF glossary:

https://slovník.gov.cz/legislativní/sbírka/111/2009/glosář

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.