NUM-DATA

PEPR FORESTT PC5 NUM-DATA

Durée : 2024 - 2030
Programme : France 2030
Portée : Nationale

Site web
Data governance
Open Science
FAIR principles
Open research data
Data science
Artificial intelligence
Taxonomies and ontologies
Data interoperability
Metadata management
Data management practices
Data sharing
Data repository
Information system

Dans le cadre de la science ouverte, le projet ciblé (PC) 5 NUM-DATA apporte un soutien en matière de numérique scientifique aux autres projets ciblés ainsi qu’aux futurs projets lauréats des appels à projets (APP). Ce soutien vise à faire évoluer les pratiques de gestion et d’exploitation des données et codes scientifiques afin d’en améliorer la valorisation, en accélérer l’usage et contribuer aux communs numériques nationaux. Les activités de NUM-DATA relèvent d’interactions avec ces projets et des partenaires d’amont ou d’aval offrant des services numériques que sollicitera ou alimentera NUM-DATA pour les besoins des projets. NUM-DATA est structuré en 5 Work Packages (WP).

Le WP1 porte sur la gouvernance et la coordination du projet (Task 1.1) ainsi que sur le porter à connaissance et la socialisation des activités au travers de communications et d’animations au sein de FORESTT (Task 1.2) et au-delà (Task 1.3). Il coordonne l’interaction globale avec les autres PC, les accompagne dans l’élaboration de leur plan de gestion de données (PGD) et contribue à l’acculturation du numérique dans les communautés du PEPR.

Le WP2 a pour objectif de proposer une évolution des pratiques de gestion des données et codes sur la base de l’analyse des pratiques en cours. Il comprend par conséquent un état des lieux des actifs numériques mobilisés/créés dans FORESTT (Task 2.1), une identification des services de nature à répondre aux besoins d’amélioration du niveau de ‘FAIRitude’ de ces actifs (Task 2.2) et la production de lignes directrices FAIR et de recommandations adressées à la communauté FORESTT (Task 2.3).

Le WP3 vise à la mobilisation de ressources et à la mise en œuvre d’outils fédérateurs pour la production de données interopérables. Il s’agit tout d’abord d’identifier et consolider les vocabulaires de références pour les communautés de FORESTT (Task 3.1). Le WP3 identifie les entrepôts de données et codes ayant vocation à accueillir, au sein du projet, les actifs numériques FORESTT et dont les métadonnées descriptives seront fédérées dans un portail FORESTT de porter à connaissance (Task 3.2). Enfin le WP3 accompagne les producteurs de données pour la construction de nouvelles bases de données lorsque d’intérêt transversal explicite et dans la mise en interopérabilité des jeux de données en utilisant les outils génériques d’annotation sémantique (Task 3.3).

Le WP4 concerne les nouveaux moyens et méthodes numériques pour l’analyse des données. Il s’agit d’une part des environnements virtuels de recherche (VRE) offrant des fonctionnalités cloud d’accès, appropriation et exploitation des données (Task 4.1). Les VRE déployés pour les projets de FORESTT s’appuieront notamment sur le service mis en place par l’Equipex+ GAIA DATA. Il s’agit d’autre part de promouvoir les approches basées sur l’IA (Task 4.2) en constituant un groupe d’intérêt FORESTT interagissant avec les acteurs institutionnels et les experts de ces méthodologies.

Le WP5 porte sur le partage et la valorisation des produits numériques FORESTT, données et codes (Task 5.1), au-delà du périmètre du PEPR contribuant ainsi aux communs numériques. Le portail FORESTT alimentera le portail de métadonnées national de DATA Terra ayant vocation à couvrir l’ensemble des données du Système Terre. Les jeux de données seront quant à eux déposés dans les entrepôts nationaux ou internationaux certifiés tel que celui de Recherche Data Gouv (RDG).

Les activités conduites dans NUM-DATA représentent un investissement humain à hauteur de 193,75 h/mois dont 93 h/mois apportés par du personnel employé en contrat à durée déterminée : un chef de projet numérique assistant les coordinateurs du PC et des WP et des personnes apportant des compétences sur le vocabulaire, les données et portails de métadonnées interopérables ainsi que sur l’annotation sémantique des données.

COLLABORATIONS

  • AgroParisTech
  • CIRAD
  • INRAE
  • IRD