Vers une démarche ontologique pour la gestion des bases de données en agroforesterie
Dans un contexte général de développement durable, les recherches menées autour de l'agroforesterie prennent tout leur sens en rendant intelligibles les interactions plante-plante dans un environnement pouvant être dégradé. Depuis plusieurs années maintenant, des données issues d'observations sur le terrain sont acquises en partenariat avec plusieurs catégories d'acteurs (en particulier des forestiers, agriculteurs et éleveurs). Il s'agit maintenant d'ouvrir ces données et de les rendre disponibles depuis le web à d'autres communautés. De plus, les études menées en agroforesterie nécessitent des approches systémiques pour par exemple mieux comprendre les mécanismes de résilience des plantes face aux changements climatiques ou encore face à la pollution des sols. Il s'agit également de rendre les données liables à d'autres jeux de données relatifs au climat et aux territoires. Le double enjeu de partage et d'interconnexion des données en agroforesterie nous rapproche de ce qu'il se pratique aujourd'hui au sein du web sémantique avec différents outils et méthodes à même de promouvoir la mutualisation de sources de données ouvertes et liées. Les technologies du web sémantique fournissent les mécanismes standards pour décrire et accéder aux ressources présentes sur le Web. Le travail de thèse s'inscrit dans ce cadre, nous réutilisons les formats standards du web sémantique et exploitons un éventail d'ontologies à la fois cadres, de domaines et terminologiques afin de proposer un modèle de connaissances, ouvert et flexible à même de rendre compte de la complexité des données déjà collectées en agroforesterie. Ce modèle se compose d’une ontologie de domaine nommée "Agroforestry". L'importance est donnée à la publication de données parfaitement décrites en privilégiant la mise en capacité de lier ces données à des données déjà disponibles sur le web (données climatiques, profils pédologiques, données sur le fonctionnement de communautés végétales, etc.). Nous avons aussi construit une ontologie terminologique dédiée à l'agroforesterie nommée "AgroforestryVoc". A terme, cette ontologie se consacrera à la qualification linguistique des concepts clés partagés par toute la communauté et sera rendue publique sur le portail "AgroPortal" (http://agroportal.lirmm.fr/). Les derniers volets du travail de thèse se concentrent sur l'interprétation des résultats dégagés sur la base de l'interconnexion des données. L’ontologie de domaine "Agroforestry", formalisée en OWL 2, est construite de manière à pouvoir raisonner sur l'ensemble des données intégrées. L'objectif est donc de faire ressortir des tendances relatives aux associations entre arbres et plantes cultivées dans l'exploitation des terres par mise en application de mécanismes inférentiels sur l'ontologie.
In a general context of sustainable development, research on agroforestry takes on its full meaning by making plant-plant interactions intelligible in a potentially degraded environment. For several years now, data from field observations have been acquired in partnership with several categories of stakeholders (in particular foresters, farmers and breeders). It is now a question of opening these data and making them available from the web to other communities. Moreover, studies conducted in agroforestry require systemic approaches in order to better understand, for example, the resilience mechanisms of plants to climate change or soil pollution. It is also necessary to make the data linkable to other data sets related to climate and territories. The double challenge of sharing and linking data in agroforestry brings us closer to what is practiced today within the semantic web with different tools and methods to promote the sharing of open and linked data sources. Semantic web technologies provide standard mechanisms to describe and access resources on the web. The work of this thesis is part of this framework, we reuse standard formats of the semantic web and exploit a range of ontologies both frameworks, domains and terminologies to propose a knowledge model, open and flexible to account for the complexity of data already collected in agroforestry. This model is composed of a domain ontology named "Agroforestry". The importance is given to the publication of perfectly described data by privileging the ability to link these data to data already available on the web (climatic data, soil profiles, data on the functioning of plant communities, etc.). We have also built a terminological ontology dedicated to agroforestry called "AgroforestryVoc". Eventually, this ontology will be dedicated to the linguistic qualification of key concepts shared by the whole community and will be made public on the "AgroPortal" (http://agroportal.lirmm.fr/). The last parts of the thesis work focus on the interpretation of the results obtained from the data interconnection. The "Agroforestry" domain ontology, formalized in OWL 2, is built in such a way as to be able to reason about the integrated data set. The objective is therefore to highlight trends in associations between trees and crops in land use by applying inferential mechanisms on the ontology.
Composition du jury :
Isabelle Mougenot MCF HDR, UR Espace Dev, UM, Montpellier - Directrice de thèse
Alexia Stokes, DR, UMR AMAP CIRAD, Montpellier - Directrice de thèse
Nathalie Hernandez, MCF HDR IRIT, Université Toulouse Jean Jaurès, Toulouse - Rapporteur
Francois Pinet, DR HDR, UR TSCF, INRAe Clermont Auvergne-Rhône-Alpes - Rapporteur
Christian Pichot, CR, UR629, INRAe, Domaine Saint Paul, Avignon - Examinateur
Sylvie Ranwez, Professeur, IMT Mines Alès, Alès - Examinateur
Fabien Liagre SCOP AGROOF, Anduze - Invité