Laboratoire d'InfoRmatique
en Images et Systèmes d'information

UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon



SimTOLE : Simulation pour le Traitement d’Ontologies à Large Echelle


Description

Type de projet : Projets transversaux 2009-2010 financés par le LIRIS

Equipes impliquées : équipe BD et équipe DRIM

Participants : Nicolas Lumineau(BD) et Lionel Médini(DRIM)


Résumé

Contexte

De plus en plus d’applications industrielles accessibles sur le Web ou par d’autres réseaux, offrent des services fondés sur le partage et l’interopérabilité des structures de connaissances issues de diverses organisations, et représentant divers aspects d’un domaine modélisé. Plusieurs approches existent pour mettre en œuvre cette interopérabilité. Parmi ces approches, on distingue l’alignement d’ontologies, qui consiste à identifier des relations entre éléments de différentes ontologies. Euzenat identifient différents types de méthodes d’alignement d’ontologies : terminologiques, structurelles, extensionnelles et sémantiques, qui proviennent de disciplines variées, telles que la fouille de données, les sciences du langage, les statistiques ou la représentation des connaissances. Nous nous intéressons ici à la mise en correspondance d’ontologies à l’aide de méthodes sémantiques fondées sur des logiques de description. De telles méthodes permettent, à l’aide d’une représentation formelle des concepts des ontologies et d’un moteur d’inférences, de découvrir automatiquement des correspondances sémantiques entre concepts de deux ontologies. Par ailleurs, les systèmes pair à pair (P2P) sont devenus des solutions incontournables pour permettre le passage à l’échelle des applications (Sigmod record, 2003). Il nous a semblé intéressant d’étendre l’approche de découverte de correspondances sémantiques afin de l’adapter aux environnements P2P.

Approche

Ce travail vise à adapter pour les réseaux pair à pair des méthodes de découverte de correspondances sémantiques entre ontologies. Cette adaptation est fondée sur les principes de segmentation (“élagage” des parties des ontologies non utilisées pour la découverte de correspondances) et de transitivité (utilisation des liens entre les différents nœuds du réseau).

Chaque pair du réseau devant inclure une ontologie, la validation de ce travail nécessite un outil de simulation de réseaux pair à pair orienté Web sémantique (i.e. permettant la manipulation et le raisonnement sur des ontologies). Ce projet vise donc à doter le LIRIS d'un outil aussi modulaire que possible afin de permettre nos expérimentations et futurs.

Objectifs et résultats attendus

Ce projet vise à développer un simulateur permettant de valider :

La plateforme réalisée permettra ensuite de tester, à l'aide de benchmarks, différents types de traitements du point de vue de la qualité des correspondances découvertes. En particulier, nous évaluerons les méthodes sémantiques utilisées (approche par inférences logiques et non probabilistes).

Verrous scientifiques abordés

Les verrous scientifiques liés à l’utilisation de notre approche dans un environnement P2P sont principalement liés au volume total d’informations manipulées et à l’impossibilité de stocker une quelconque information de manière centralisée. Il est également nécessaire de considérer l’évolution des correspondances découvertes face aux connexions et déconnexions des pairs. Enfin, il est possible de tirer partie du paradigme P2P pour améliorer le fonctionnement de cette approche, en termes d’efficacité et de nombre de correspondances découvertes à l'intérieur de communautés de pratiques ou d'intérêt. Ces verrous sont de deux types :

Solutions envisagées

Du point de vue du simulateur, le projet vise à mettre au point un framework en Java dans lequel il sera possible d'insérer le code correspondant aux objets de recherche à valider. Plus précisément, nous souhaitons y inclure un simulateur P2P (Peersim) et un moteur d'inférences (RACER). Pour cela, un TER de M1 a été déposé, ainsi qu'une étude bibliographique de M2 SIR pour trouver un jeu d'ontologies utilisables dans un contexte distribué. Une fois le simulateur et les jeux d’ontologies opérationnels, ce simulateur permettra de tester nos algorithmes de segmentation et de localisation des pairs utiles à la découverte de correspondances. Dans un second temps, il s'agit de développer un algorithme de gestion des communautés à partir de la métrique qui aura été élaborée. L'objectif est de déposer, durant la deuxième année du projet, un sujet de M2 recherche sur cette thématique.