Aider au recensement des bases de donnes infra-mensuelles pour DBnomics
DBnomics (https://db.nomics.world/)
La base de données DBnomics rassemble une grande masse d'informations économiques (63 fournisseurs, 21,718 bases de données et 719,637,949 séries), mais assez peu à haute fréquence (hebdomadaire, journalière). Le challenge consiste à opérer un recensement le plus complet possible des bases de données économiques des autorités administratives françaises et étrangères avec des données infra mensuelles (par webscraping ou autre méthode jugée pertinente). Ce recensement devra indiquer : le pays, la source (avec lien vers le site Internet), la liste des séries et leur fréquence, la date de début et toute autre information pertinente. Le fichier final devra se présenter sous la forme d'un fichier excel ou assimilé. Une fois les programmes mis au point, ils seront transmis avec une documentation pour que DBnomics puisse actualiser les sources sur les données haute fréquence régulièrement. Idéalement, les programmes seront sous Python (ou autre logiciel standard assimilé). A titre d'information sur le contenu du stage (non utile pour le présent challenge) : Pour avoir une idée du code à développer une fois qu’une source a été identifiée, les deux fetchers suivants peuvent être utiles : John Hopkins University : https://git.nomics.world/dbnomics-fetchers/jhu-fetcher (comme la source est déjà un dépôt GIT, il n’y a pas de programme download.py Le git pull est fait directement dans gitlab-cli) US Energy Information Agency : https://git.nomics.world/dbnomics-fetchers/eia-fetcher Ces deux exemples montrent ce qui sera à réaliser durant le stage. Ils n'aident pas pour le challenge qui consiste uniquement à identifier des sources de données à haute fréquence
Stage à la Banque de France d'une durée pouvant aller jusqu'à 6 mois
0 €

The winners of this challenge will receive a certificate of participation attesting to their skills.
From 20/04/2020 until 31/07/2020.
Enzo BUTHIOT composed of :
- Enzo BUTHIOT