Skip to content

Commit

Permalink
Update update_inputs.Rmd
Browse files Browse the repository at this point in the history
#only remove duplicates which do not have information regarding management #156
  • Loading branch information
jrhillae committed May 21, 2024
1 parent 0cef799 commit a8eea5d
Showing 1 changed file with 17 additions and 8 deletions.
25 changes: 17 additions & 8 deletions src/Vespa velutina management/update_inputs.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -249,25 +249,25 @@ hierdoor komt 1 van de 2 meldingen van de duplicaten check niet langer voor
in de gekuiste dataset (zie `dupli_missing_ID1` & `dupli_missing_ID2`).
In uitzonderlijke gevallen missen beide meldingen (zie `dupli_missing_both`).
```{r IASSET: duplicaten prep}
#selecteer duplicaten paren op basis van script Diego
##selecteer duplicaten paren op basis van script Diego
dupli_nest_iasset <- dupli_nest_iasset_raw %>%
filter(is_duplicate == 1)
#checken of alle paren nog volledig in opgekuiste databank (zonder duplicaten) zitten
#duplicaatparen waarvan ID1 reeds als duplicaat was aangeduid in iasset databank
##checken of alle paren nog volledig in opgekuiste databank (zonder duplicaten) zitten
##duplicaatparen waarvan ID1 reeds als duplicaat was aangeduid in iasset databank
dupli_missing_ID1_test <- dupli_nest_iasset %>%
filter(!ID1 %in% data_nest_iasset$id)
#duplicaatparen waarvan ID2 reeds als duplicaat was aangeduid in iasset databank
##duplicaatparen waarvan ID2 reeds als duplicaat was aangeduid in iasset databank
dupli_missing_ID2 <- dupli_nest_iasset %>%
filter(!ID2 %in% data_nest_iasset$id)
#duplicaatparen waarvan ID1 en ID2 ontbreken in opgekuiste iasset databank
##duplicaatparen waarvan ID1 en ID2 ontbreken in opgekuiste iasset databank
dupli_missing_both <- dupli_nest_iasset %>%
filter(!(ID2 %in% data_nest_iasset$id) & !(ID1 %in% data_nest_iasset$id)) %>%
write_csv("./data/interim/Vespa_iAsset_dupli_missing_both.csv")
#duplicaten waarvan beide ID's nog in opgekuiste dataset zitten
##duplicaten waarvan beide ID's nog in opgekuiste dataset zitten
dupli_nest_iasset <- dupli_nest_iasset %>%
filter((ID2 %in% data_nest_iasset$id) & (ID1 %in% data_nest_iasset$id))
Expand All @@ -278,7 +278,7 @@ test_mutiple_1 <- dupli_missing_both %>%
filter(ID1 %in% dupli_nest_iasset$ID1 | ID2 %in% dupli_nest_iasset$ID1)
## duplicaten waarvan 1 deel van de set reeds als duplicaat in iasset geflagged
# werdt
# werd
test_mutiple_2 <- dupli_missing_both %>%
filter(!ID1 %in% dupli_nest_iasset$ID1 | !ID2 %in% dupli_nest_iasset$ID1) %>%
filter(ID1 %in% data_nest_iasset$id | ID2 %in% data_nest_iasset$id)
Expand All @@ -305,8 +305,17 @@ table(test_mutiple_3$duplicaat, useNA = "ifany") #=> alle ids in deze set werden
```

```{r IASSET: remove duplicaten}
#obtain list of all managed nests
managed_nests <- data_nest_iasset%>%
filter(result=="succesvol")%>%
select(id)
#only remove duplicates which do not have information regarding management
dupli_nest_iasset <- dupli_nest_iasset%>%
mutate(duplicate_to_remove=case_when(!(ID1 %in% managed_nests$id) & (ID2 %in% managed_nests$id) ~ ID1,
TRUE ~ ID2))
data_nest_iasset <- data_nest_iasset %>%
filter(!id %in% dupli_nest_iasset$ID2)
filter(!id %in% dupli_nest_iasset$duplicate_to_remove)
```

```{r IASSET: Export}
Expand Down

0 comments on commit a8eea5d

Please sign in to comment.