Skip to content

Latest commit

 

History

History
125 lines (87 loc) · 3.85 KB

README.md

File metadata and controls

125 lines (87 loc) · 3.85 KB

🕵️‍♂️ Cold Case Dataset Scraper 🕵️‍♀️

Dutch version down below

Cold Case Python License

Welcome to the Cold Case Dataset Scraper repository! This project is developed for the University of Utrecht and provides a dataset of Dutch cold cases. The repository includes both the dataset and a web scraper to ensure you always have the latest data.

📄 Description

This repository contains:

  • A dataset of Dutch cold cases
  • A web scraper script to generate and update the dataset

The web scraper is designed to fetch the latest cold case information, ensuring your dataset is always up-to-date.

🚀 Features

  • Up-to-date Data: Always have the latest information with the included web scraper.
  • Easy to Use: Simple script to run and generate the dataset.
  • Detailed Information: Comprehensive data on Dutch cold cases.

📊 Dataset

The dataset includes the following information for each cold case:

  • Last Update (lastupdate)
  • Date of Delict (date of delict)
  • Place of Delict (plaats delict)
  • Case Number (zaaknummer)
  • Since (sinds)
  • Missing From (vermist_uit)

🛠️ Usage

To generate or update the dataset, simply run the provided script. Make sure you have Python 3.8 or higher installed.

Step-by-Step Guide

  1. Clone the repository:

    git clone https://github.com/LeoHanhart/coldcase_dataset_nl.git
    cd coldcase-dataset-scraper
  2. Install the required dependencies:

    pip install requests beautifulsoup4 pandas
  3. Run the scraper script to generate the dataset:

    python ColdCaseWebscraper.py

Example

Running the script:

Dutch version

python ColdCaseWebscraper.py

🕵️‍♂️ Cold Case Dataset Scraper 🕵️‍♀️

Cold Case Python License

Welkom bij de Cold Case Dataset Scraper repository! Dit project is ontwikkeld voor de Universiteit Utrecht en biedt een dataset van Nederlandse cold cases. De repository bevat zowel de dataset als een web scraper om ervoor te zorgen dat je altijd de nieuwste gegevens hebt.

📄 Beschrijving

Deze repository bevat:

  • Een dataset van Nederlandse cold cases
  • Een web scraper script om de dataset te genereren en bij te werken

De web scraper is ontworpen om de nieuwste informatie over cold cases op te halen, zodat je dataset altijd up-to-date is.

🚀 Kenmerken

  • Up-to-date Gegevens: Altijd de nieuwste informatie met de meegeleverde web scraper.
  • Eenvoudig te Gebruiken: Eenvoudig script om te draaien en de dataset te genereren.
  • Gedetailleerde Informatie: Uitgebreide gegevens over Nederlandse cold cases.

📊 Dataset

De dataset bevat de volgende informatie voor elke cold case:

  • Laatste Update (lastupdate)
  • Datum van Delict (date of delict)
  • Plaats van Delict (plaats delict)
  • Zaaknummer (zaaknummer)
  • Sinds (sinds)
  • Vermist Uit (vermist_uit)

🛠️ Gebruik

Om de dataset te genereren of bij te werken, hoef je alleen maar het meegeleverde script uit te voeren. Zorg ervoor dat je Python 3.8 of hoger hebt geïnstalleerd.

Stapsgewijze Handleiding

  1. Clone de repository:

    git clone https://github.com/LeoHanhart/coldcase-dataset-scraper.git
    cd coldcase-dataset-scraper
  2. Installeer de vereiste dependencies:

    pip install requests beautifulsoup4 pandas
  3. Voer het scraper script uit om de dataset te genereren:

    python ColdCaseWebscraper.py

Voorbeeld

Het script uitvoeren:

python ColdCaseWebscraper.py