-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Guidelines Hantera persistenta identifierare för dataset som laddas upp på flera ställen #21
Comments
Exempel hur konstigt dataverkstaden refererar till dataset/specifikation och länkröta skapas
Korrekt borde vara att dataverkstaden jobbar med persistenta identifierare och inte massa sköra websökningar, inget datum finns på dataportalens sida om Matsvinn men dagens hantering av att länka verkar bli fel redan efter några månader enl. troligen den spec matsvinn dom försöker länka så skapades den för 9 månader sedan = 28 mars 2023
|
liknande problem med dataportalen att identifiera organisation där organisationsnumret troligen är unikt men man geggar till det med en konstig url som pekar på en sida som inte finns hos KB... organisationer identifieras med org nummer som pekar på en sida utan landningssida exempel sökning
![]() fel hos dataportalen eller kb?
|
"Strings not things" dvs. här saknas persistenta identfierare eller peka med schema.org/sameAs och vi får gegga 3.0 för nyckelord
![]() |
Verkar nu som svar skickas in i Google docs ;-) och saker stängs med motivering vi jobbar med det redan... jag vill se
![]() En reality check är att
Är det mer ryggen fri än styra upp? |
![]()
|
IA
Contact Details
[email protected]
What benefits does the suggestion solve?
Idag laddas ett dataset upp ofta på massa olika ställen, samma dataset bör ha EN persistent identifierare så att konsumenten ser att det är samma data på alla olika ställena se hur svenska dataportalen och edp inte verkar utbyta persistenta identifierare och inte heller den enskilda kommunen /myndigheten #82 Persistenta identifierare för dataset - ekosystem --> att jag som konsument omöjligen kan avgöra om det är "samma" data
Se "Building Google Dataset Search and Fostering an Open Data Ecosystem"
Connecting Replicas of Datasets
"It is very common for a dataset, in particular a popular one, to be present in more than one repository.
We use a variety of signals to determine when two datasets are replicas of each other. For example,
schema.org has a way to specify the connection explicitly, through schema.org/sameAs,
which is the best way to link different replicas together and to point to the canonical source of a dataset.
Other signals include two datasets descriptions pointing to the same canonical page, having the same Digital Object Identifier (DOI),
sharing links for downloading the dataset, or having a large overlap in other metadata fields.
None of these signals are perfect in isolation, therefore we combine them to get the strongest possible indication of when two datasets are the same."
Feature suggestion description
En tydlighet i specifikationen om vikten av att ett datatset inte har olika persistenta identfierare på olika ställen eller som i fallet #82 att det enbart hos EDP verkar som de sätter en persistent identifierare och anger hur detta data skall citeras men detta sätt att citera datasetet delas inte av svenska dataportalen utan vi får 2 datasilos
Alternative solutions
schema.org/sameAs
Additional information
No response
The text was updated successfully, but these errors were encountered: