Thème CoolDB - Collecte, gestion et diffusion collaborative de données en écologie et en botanique

Contexte et enjeux

La collecte, la gestion et la validation de données botaniques, qui sont par nature souvent complexes et hétérogènes, jouent un rôle crucial pour de nombreuses activités de recherche et les applications qui en découlent. Actuellement, les modalités d’agrégation de données en écologie et botanique sont (i) soit basées sur des solutions individuelles, généralement artisanales, et pour lesquelles la mise en œuvre d’un travail collaboratif et le partage sont difficiles, (ii) soit basées sur des solutions très intégratrices, au sein d’infrastructures centralisées et statiques (système d’information dédié) et dans lesquels les données mobilisées se retrouvent difficilement ré-exploitables par d’autres travaux de recherche (perte de contrôle, modèle de données inadaptées, etc ...). Compte-tenu des volumes de données scientifiques actuellement produites en écologie et botanique, qui sont à la fois très complexes, véloces et diversifiés, des nouvelles questions de recherche qui nécessitent des approches de plus en plus globales et/ou intégratives, et de la multitude des disciplines mobilisées, de nouvelles formes d’agrégation, gestion et exploitation des données sont à développer.

Objectifs

L’objectif de nos travaux est de rendre possible et/ou plus facile la génération et l’exploitation de nouveaux corpus de données en écologie et botanique, par le développement d'actions, de méthodes et d'outils innovants d’accès à l’information destinés à la fois au monde de la recherche académique et au grand public.

Approche

Nous proposons de mettre en place des méthodes en lien avec les sciences collaboratives et les sciences informatiques afin de faciliter la constitution, l’exploration et l’utilisation de bases de données écologiques et botaniques. La mutualisation et la diffusion des méthodes et logiciels doit permettre de mobiliser davantage de sources de données issues de la recherche mais aussi du grand public, et qui étaient jusque là inaccessibles faute de moyens appropriés pour les gérer et les diffuser. Nous souhaitons permettre à des groupes de travail s’intéressant à une ou plusieurs thématiques spécifiques :

  •  de constituer des jeux de données éventuellement de manière collaborative ;
  •  de mettre en place des systèmes d’exploration et de recherche d’information innovants, de fouille et/ou d’indexation de données (similarités visuelles, recherche multi-critères, classification par apprentissage) et la mise en place de systèmes experts comme l’aide à l’identification de plantes ou des applications de suivi écologique ;
  •  de valider de manière collaborative ces données et de publier facilement les bases constituées (site web, GBIF, etc...) ;
  •  de gérer ces données de manière distribuée afin que chacun puisse en garder le contrôle et les échanger au sein de groupes d’intérêt.

Ce programme s’appuie sur notre expérience dans le domaine de l’informatique appliquée à la biodiversité (aussi bien sur des flores tempérées que tropicales, cultivées que naturelles). Il n’a pas de pôle géographique spécifique, bien que nos travaux se structurent depuis plusieurs années avec des collaborateurs en Europe, en Amérique du Sud, dans l’océan indien et en Océanie. Nous proposons d'exploiter, tester et faire avancer les recherches sur les grandes masses de données, afin de répondre aux nombreuses attentes dans ce domaine de la communauté scientifique travaillant sur la biodiversité et l’agro-biodiversité, tout en fédérant une communauté (de scientifiques et non-scientifiques) autour de ces questions à un très large niveau géographique.
Ces travaux contribueront (i) à mieux sécuriser les flux d’exploitations des données produites, (ii) à en assurer une plus grande pérennité et visibilité, (iii) à promouvoir de nouvelles formes de collaborations entre équipes de recherche de différentes disciplines.

Résultats attendus

  •  Développement d'infrastructures logicielles pour faciliter l’exploration, la collecte, la gestion, la validation et la diffusion de gros volumes de données botaniques et écologiques.
  •  Diffusion de logiciels et mise en place de réseaux de collaborations avec différents instituts de recherche et techniques.

Projets

Acronyme Intitulé Durée
FLORIS'TICFloris'tic2015 - 2018
ARCHIWOODMorphologie végétale, anatomie et architecture des espèces endémiques de bois à Madagascar2014 - 2016
WIKWIOWeed Identification and Knowledge in the Western Indian Ocean2013 - 2016
PL@NTNETObservation et identification interactive des plantes2009 - 2013

Publications majeures

Toutes les publications
  • A. Joly, H. Goëau, P. Bonnet, V. Bakic, J. Barbe, S. Selmi, I. Yahiaoui, J. Carré, , E. Mouysset, J.-F. Molino, N. Boujemaa, D. Barthélémy, 2014. Interactive plant identification based on social image data. Ecological Informatics, 23 : 22-34. [Lien éditeur]
  • Joly A., Goëau H., Glotin H., Spampinato C., Bonnet P., Vellinga W.-P., Planque R., Rauber A., Fisher R., Müller H., 2014. LifeCLEF 2014: Multimedia Life Species Identification Challenges. In: E. Kanoulas, M. Lupu, P. Clough, M. Sanderson, M. Hall, A. Hanbury and E. Toms. Information Access Evaluation. Multilinguality, Multimodality, and Interaction. Berlin: Springer International Publishing, 229-249. (Lecture Notes in Computer Science; 8685). [Lien éditeur]
  • Goëau, H., Bonnet, P., Joly, A., Affouard, A., Bakic, V., Barbe, J., Dufour-Kowalski, S., Selmi, S., Yahiaoui, I., Vignau, C., Barthélémy, D., Boujemaa, N., 2014. Pl@ntNet mobile 2014: Android port and new features. In Kankanhalli, M., Rueger, S., Manmatha, R. (Eds) ICMR 2014 - Proceedings of the ACM International Conference on Multimedia Retrieval . New York : ACM Press, 527-258 p. [Lien éditeur]

Galerie d'images