-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Florabank taxon ID met meerdere NBN keys #226
Comments
In de nieuwe versie van het package zal niet meer met NBN-keys gewerkt worden, dus moest dit al ooit een probleem geweest zijn, dan zou het binnenkort opgelost zijn. Maar vermits die query sterk afwijkt van de manier waarop de databank bevraagd hoort te worden, denk ik niet dat er bij de berekening van de LSVI ooit een probleem geweest is. (Die synoniementabel wordt enkel gebruikt ingeval de gebruiker een onbekend junior synoniem ingevoerd heeft; de basislijst van gebruikte taxa voor de berekeningen zit in tabel |
Het is lang geleden, maar ik vermoed dat ik dit tegen ben gekomen bij het klaarmaken van https://zenodo.org/records/10561497. Mogelijk heb ik toen onterecht gedacht dat dit een probleem was. |
Is er eigenlijk een reden dat je in die lijst alle junior synoniemen wil opnemen? Mij lijkt het eerlijk gezegd veel gemakkelijker om enkel de accepted names aan te bieden, dat vermijdt mogelijk dat een hele hoop dubieuze synoniemen gebruikt gaan worden omdat niet elke gebruiker even goed weet welke naam hij precies moet kiezen. |
Het was inderdaad de bedoeling om enkel accepted names in de lijst te hebben. Ik heb je een mail doorgestuurd waarin dit staat. Mogelijk zijn er een paar door de mazen van het net geglipt. |
Euh, dan snap ik al helemaal niet meer waarom je bovenstaande query zou gebruikt hebben waarmee je die hele synoniemenlijst bevraagt en niet gewoon de tabel |
Die query komt letterlijk uit het LSVI package: LSVI/R/invoercontroleData_soortenKenmerken.R Lines 124 to 130 in c709f03
Mijn bedoeling was om het excelbestand met de florabanklijst zonder synoniemen, die me door Gert werd bezorgd en op zenodo moest geplaatst worden, te vergelijken met de hoe het LSVI package gebruikt wordt. Ik heb daarvoor gekeken hoe het LSVI package omgaat met soorten (cf de query soorten hierboven) en dan beide lijsten met elkaar vergeleken om te zien of er problemen waren. Cf doorgestuurde email waar er drie problemen gemeld worden:
De eerste was niet problematisch. De tweede heb jij toen in detail bekeken en de nodige oplossingen bezorgd aan Gert (zie je follow-up e-mail). Het derde is waar dit issue over gaat. |
Ah, oei, ik had vrijdag niet gezien dat die NbnTaxonVersionKey uit Taxon kwam en niet uit TaxonSynoniem. Dan was dit wel relevant, maar bij de huidige aanpassingen zal het niet meer helemaal van toepassing zijn. In de nieuwe versie van het package zal die query nl. vervangen worden door het ophalen van een csv 'Taxonlijst'. Voor deze tabel wacht ik nog op databeheer, maar ik ben toevallig net (n.a.v. het opnieuw testen van de voorbeeldcode van issue #225) een unittest aan 't schrijven om te testen of in deze tabel de GbifUsageKey uniek is bij het negeren van verschillende (schrijfwijzen van) taxonnamen. Maar n.a.v. dit issue zal ik het script nog wat grondiger uitpluizen en indien nodig extra testen schrijven om gelijkaardige problemen zeker te vermijden. |
Er zijn een aantal soorten met dezelfde wetenschappelijke naam en toch meerdere NBN keys. Misschien iets om eens nader te bekijken:
Hier is code om deze id's te vinden:
The text was updated successfully, but these errors were encountered: