.
.
  • Agrandir le texte
  • Réduire le texte
  
reference-dimage

Travailler au pôle Science des données

Impression


L’exploitation des données est devenue un outil de choix pour l’évaluation des politiques publiques, dans un souci grandissant d’objectivation des faits. Dans ce contexte, le pôle Science des données a été créé en février 2019 avec pour rôle principal d’appuyer les missions de l’IGF sur les sujets quantitatifs. Il est actuellement composé de 5 personnes : une responsable, un adjoint et trois data scientists.

En pratique, le pôle déploie des méthodes quantitatives innovantes – qu’il s’agisse d’économétrie, de « machine learning », de visualisation de données, de méthodes de micro-simulation… – pour répondre à des questions concrètes de politiques publiques dans des domaines aussi variés que la fiscalité, l’environnement, ou la santé. A ce titre, ses membres sont conduits à participer activement à certaines missions de l’IGF.

Pour réaliser ses travaux, le pôle a accès à un grand nombre de bases de données individuelles, parmi lesquelles des données fiscales sur les ménages et les entreprises, des enquêtes réalisées par l’Insee, ou encore de nombreuses sources administratives. Il est habilité par le Comité du secret statistique à accéder à ces données via le centre d’accès sécurisé aux données.

Vous pouvez prendre connaissance ici des derniers appels à candidatures de data scientist et de data scientist junior

Quelques exemples de missions auxquelles le pôle a apporté un appui :



Mission d’assistance au Comité de suivi et d’évaluation des mesures de soutien financier aux entreprises confrontées à l’épidémie de Covid-19 (« Comité Coeuré »)

Dans le cadre de la mission d’appui au Comité Cœuré, le pôle était en charge du suivi et de l’évaluation quantitative des mesures du suivi en collaboration avec France Stratégie, de juin 2020 à la publication du rapport final en juillet 2021.

Cette mission a été l’occasion pour le pôle de développer trois de ses compétences :

  • « Data Engineering » : le pôle a constitué une base inédite sur les 3,5 millions d’entreprises bénéficiaires des mesures d’urgences. Cette base est le résultat de la concaténation des données relatives aux quatre dispositifs de soutien étudiés (activité partielle, fonds de solidarité, prêts garanti par l’Etat, reports de cotisations sociales), des caractéristiques financières des entreprises (FARE, LIFI, FIBEN) et des données sur l’emploi (Sequoia). Un des enjeux pour le pôle fut de construire code permettant une mise à jour en quasi-continu de la base au fil de la crise ;
  • « Data Visualisation » : le pôle a caractérisé le recours des entreprises aux mesures de soutien selon  leur taille, leur secteur ou leurs caractéristiques financières avant crise, ainsi que l’intensité du recours et le recours croisé aux dispositifs. Dans le cadre des publications du Comité, le pôle devait porter une attention particulière aux représentations graphiques choisies afin de transformer des données brutes en une information pertinente pour le lecteur.
  • « Micro-simulation » : Pour le rapport final, le pôle a produit des premières estimations de l’effet des dispositifs de soutien sur l’excédent brut d’exploitation (EBE) des entreprises (voir graphique ci-dessous). Celles-ci ont été réalisées grâce à la construction d’un modèle de micro-simulation reposant sur un modèle empirique de prédiction de la valeur ajoutée à partir des déclarations annuelles de TVA, des données de masse salariale et des données de recours aux dispositifs de soutien. Afin d’attester de la robustesse du modèle, le pôle a notamment cherché à mettre cohérence le choc observé à partir des données « micro » avec le choc mesuré au niveau macroéconomique par l’Insee.
     

Un exemple de travaux réalisés dans le cadre du comité : l’impact différencié de l’activité partielle et du fonds de solidarité sur l’EBE (excédent brut d'exploitation) 2020 pour le secteur de l’hébergement restauration

EBE-1.jpg


Champ : entreprises du secteur marchand, hors secteurs financier et agricole.
Sources : Données DGFiP (FS, TVA), Dares (AP), Acoss (RCS, DSN agrégées), Bpifrance et DG Trésor (PGE), FARE (Insee, DGFiP).
Note de lecture : En l’absence de dispositifs de soutien, 69 % des entreprises des entreprises du secteur de l’hébergement restauration, représentant 69 % de l’emploi du secteur aurait connu une baisse de leur EBE supérieure à 25 pts de valeur ajoutée en 2020. En tenant compte seulement de l’activité partielle, cette part s’élève à 51 %.