Giter VIP home page Giter VIP logo

etl-andb's People

Contributors

miconschorsij avatar wouterbeek avatar

Watchers

 avatar  avatar  avatar  avatar

Forkers

iish

etl-andb's Issues

[CoW/Druid] Integratie gegevens uit verschillende datasets

Data over 1 persoon is verspreid over de personen dataset en 3 kaarten datasets.

  1. https://druid.datalegend.net/MiconSchorsij/andbuniekepersonen/browser?resource=https%3A%2F%2Fiisg.amsterdam%2Fid%2Fadb-andb%2F76584430-a805-4d51-b605-6f2a0875318b

  2. https://druid.datalegend.net/MiconSchorsij/ADB/browser?resource=https%3A%2F%2Fiisg.amsterdam%2Fid%2Fadb%2FAMSAB_0558_2193

In a) staat bij de persoon aangegeven welke kaarten hij heeft en in b) staat bij de kaart aangegeven van welke persoon hij is. Als alle graphs in 1 dataset zouden zitten zou deze informatie automatisch geintegreerd worden. Zoals ook in de voorbeeld data van Wouter te zien is:
https://druid.datalegend.net/andb/andb2/browser?resource=https%3A%2F%2Fiisg.amsterdam%2Fid%2Fdiamantbewerkers%2F7bd29f33-cfd6-4f3c-ac11-d786c255ebe3

Of in mijn test op met personen en ADB kaarten op https://druid.datalegend.net/MiconSchorsij/ANDBall

Maar we hebben gekozen voor losse datasets. Hoe nu toch de integratie van de data te realiseren? Of is dit geen issue?

Afbeeldingen van de kaarten

De UUID's van de afbeeldingen zitten niet in de brondata. Hoe de links naar de afbeeldingen vanuit de linked data tot stand te brengen?

[CoW] Time:before/after

Ik heb een voorbeeld nodig van hoe je het time:before / after op correcte wijze in het CoW script opneemt. Bijvoorbeeld bij de adressen in de ADB json.

[CoW] Afhandeling empty objects

Normaal gesproken worden worden lege velden genegeerd, maar niet als je een array maakt. Ik heb onvoldoende ervaring om dit in het CoW script af te handelen. Voorbeeld: repeterende adresvelden en samengevoegde datumvelden in het ADB CoW script.

Samenvoegen data via CoW script

Data bestaan uit losse dag, maand en jaar velden. Kan je hier door middel van een stukje script in de CoW json complete data van maken?

[Datamodel/CoW] Persoonsgegevens op kaart

Naam en geboorte/sterfdatum uit de personendataset zijn leading. Op de kaarten komen soms namen en data voor die afwijken. Die willen we ook weergeven als "naam op kaart", "datum op kaart" Hoe dit aan te pakken.

Data

In de kaarten datasets zijn data altijd als losse velden day / month / year opgeslagen. Is het verstandig om die velden al in de csv's samen te voegen of is er een andere oplossing?

[CoW] Inverse relaties

Ik heb een voorbeeld nodig van hoe je op correcte wijze de inverse relaties in het CoW script verwerkt, zoals bijvoorbeeld hasMembership - member

[Datamodel] Verwerking lidmaatschapsinformatie ADB

De dataset van de ADB (Antwerpen) bevat een cluster informatievelden over het lidmaatschap (mmb-01 t/m 05) waar ik geen weg mee weet. Deze velden zijn niet nieuw, ze zitten ook in de huidige dataset op Druid, maar ik ben niet tevreden met de manier waarop. Deze kaart is een voorbeeld:
https://druid.datalegend.net/IISG/andb/browser?resource=https%3A%2F%2Fiisg.amsterdam%2Fresource%2Fadb-andb%2Fcard%2Fadb-leerlingen-6496
Het probleem is dat deze clusters informatie bevatten over in- en uitschrijving als lid, maar dat dit door elkaar gebeurt, zodat er geen logische indeling te maken is. Aan de de data is op deze manier nauwelijks een logische betekenis te geven. Hoe hier mee om te gaan?
adb_lidmaatschapsinformatie

Omzetting naar Linked data met CoW

De data in de kaartendatasets bestaat uit geneste clusters van informatie, die bovendien kunnen repeteren. Hoe dit moet worden uitgewerkt in de CoW scripts is nog onbekend. Expertise op dit vlak is noodzakelijk.

Opbouw shapes

Er is voor mij onduidelijkheid ontstaan over de correcte wijze waarop shapes als properties van andere shapes gebruikt kunnen worden. Ik maak even gebruik van een voorbeelden die ik in de originele shapes file vind.

Voorbeeld 1: in de relatie tussen de shape WorkEvent en Workshop wordt op onderstaande manier naar de Workshop verwezen (naar de klasse, niet eens naar de shape).

shape:WorkEvent
  sh:property
    [ sh:class andb:Workshop;
      sh:path andb:workshop ],
    shape:after,
    shape:before,
    shape:date,
    shape:label;
    sh:targetClass andb:WorkEvent.

Maar als de shape Workshop verwijst naar de shape Adress staat er simpelweg dit:

shape:Workshop
  sh:property
    shape:address,
    shape:label,
    shape:name;
  sh:targetClass andb:Workshop.

Waarom staat daar dan niet:

[ sh:class andb:Address;
  sh:path andb:address ]

Wat is het verschil en wanneer pas je welke methode toe?

Personen

Hoe kunnen we zowel de biografische data uit de unieke personen dataset als ook de persoonsgegevens uit de kaarten datasets, die deels overlappen, maar niet altijd identiek zijn in het linked data model onderbrengen?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    ๐Ÿ–– Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. ๐Ÿ“Š๐Ÿ“ˆ๐ŸŽ‰

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google โค๏ธ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.