Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Vilka properties ska / får anges på en datamängdsserie? #103

Open
matthiaspalmer opened this issue Apr 8, 2024 · 4 comments
Open

Vilka properties ska / får anges på en datamängdsserie? #103

matthiaspalmer opened this issue Apr 8, 2024 · 4 comments

Comments

@matthiaspalmer
Copy link
Collaborator

matthiaspalmer commented Apr 8, 2024

What benefits does the suggestion solve?

Metadata på en datamängdsserie gör det enkelt att få översikt över datamängdsserien

Feature suggestion description

Utöver de som anges i kapitel 7.8 i DCAT-AP 3.0 (applicable legislation , contact point , description , frequency , geographical coverage , modification date , publisher , release date , temporal coverage , title) vore det lämpligt också med dcat:theme samt dcatap:hvdCategory, se ärende SEMICeu/DCAT-AP#362.

@matthiaspalmer
Copy link
Collaborator Author

Det verkar lämpligt att också inkludera:

  1. dcat:keyword - som komplement till kategorierna
  2. dcterms:conformsTo - när specifikationer sammankopplas med datamängder vill man inte ha en relation till varje datamängd i en datamängdsserie, då blir det viktigt att ha relationen till datamängdsserien.
  3. dcat:landingPage - att ha en landningssida känns mer relevant för en datamängdsserie än för datamängderna i serien. Att bara kunna ange den för datamängderna inne i datamängdsserien gör den mindre synlig och skulle inte motsvara helheten.
  4. dcterms:related - relationer bör kunna finnas på helheten såväl som på delarna
  5. dcat:qualifiedRelation - samma argument som för dcterms:related
  6. foaf:page - dokumentation behövs på serien också

Notera att enligt DCAT kapitel 12.2 kan metadata på Datamängdsserien delas in i två grupper:

  1. metadata som gäller för datamängdsserien
  2. metadata som gäller som talar om de dimensioner som serien reflekterar (tid, rymd, kategorier etc.)

Om man ska vara noga bör metadata tolkningen 1 ovan delas in i två undergrupper:
1a. metadata som gäller för datamängdsserien som serie betraktad
1b. metadata som gäller för den data som datamängdsserien representerar

Tolkning 1a. stödjs av inledande meningen i kapitel 12 som säger:

With "dataset series" we refer to data, somehow interrelated, that are published separately.

Tolkning 1b. stödjs av skrivningen i kapitel 12.2 om att dcterms:accrualPeriodicity ska tolkas som uppdateringsfrekvensen av nya datamängder som en del av serien

Sammantaget tyder skrivningarna i kapitel 12 på att en datamängdsserie måste tolkas på ett bredare sätt och att det är endast för en del av egenskaperna som DCAT explicit angett vilken tolkning som är den rätta. Dvs. det är fritt för producent och konsument att göra den tolkning som bäst passar.

Förslaget ovan är att vi lägger till dessa egenskaper, men lämnar det fritt att använda dem för de olika tolkningarna 1a, 1b, och 2.

Vi exemplifierar med foaf:page, dvs dokumentation. Dokumention som används på en datamängdsserie tillåts alltså handla brett om dataserien själv (1a), om datan som man når via datamängder i dataserien (1b) eller hur dataseriens dimensioner är organiserade (2).
Hur lätt det är att se en distinktion mellan 1a, 1b och 2 beror på vilken egenskap man talar om, för foaf:page blir 1a och 2 svåra att separera.

@bjornhagstrom
Copy link

Jag har lite svårt att greppa skillnaderna här men om allt tillåts kanske det inte spelar så stor roll. Men ett eller flera exempel skulle kanske göra frågan tydligare om du vill ha mer feedback?

@matthiaspalmer
Copy link
Collaborator Author

matthiaspalmer commented May 17, 2024

@bjornhagstrom Inser att det blev för teoretiskt.

Jag föreslår att de som känner sig manade går igenom skrivningarna för varje property under datamängdsserie. Om någon av dem inte känns klar bör de förtydligas.

@matthiaspalmer
Copy link
Collaborator Author

Fält som motsvarar union beskrivs så på datamängdsserien.
Alla som bör vara lika har annoterats med en ny rekommendation 21.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants