Skip to content
This repository has been archived by the owner on Jul 20, 2022. It is now read-only.
/ trackdechets-etl Public archive

Consolidation d'une base de données des entreprises liées au secteur du déchet

Notifications You must be signed in to change notification settings

MTES-MCT/trackdechets-etl

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

79 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

trackdechets-etl

Scripts de transformation de données dans le cadre de Trackdéchets, orchestrés avec Airflow. Les premiers scripts serviront à préparer les données nécessaires à la production de fiches d'inspection pour les inspecteurs de l'environnement.

Configuration

Le projet utilise pipenv pour la gestion des dépendances.

  1. Installez les dépendances (apache-airflow est installé plus tard) :
pipenv install
  1. Faites une copie de sample.env.sh vers env.sh
  2. Ajustez les variables de env.sh à votre environnement
  3. Sourcez env.sh afin de déclarer les variables d'environnemnet (source env.sh)
  4. Installez et démarrez Airflow :
./start.sh
  1. Dans Airflow, activez le DAG icpeETL
  2. À droite, cliquez sur le bouton 'Lecture', puis 'Trigger DAG'

Le DAG est exécuté.

Notes de version

21/03/2022

  • ajout des données GEREP pour la siretisation des données ICPE
  • ajout de nouvelles rubriques aux rubriques Trackdéchets
  • amélioration des stats de siretisation
  • mise à jour d'Airflow (2.2.3 => 2.2.4)

About

Consolidation d'une base de données des entreprises liées au secteur du déchet

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published