Thèse de Kamel Taouche


Sujet :
Traitement des requêtes agrégatives dans un contexte distribué à grande échelle

Date de soutenance : 30/09/2017

Encadrant : Mohand-Said Hacid
Co-encadrant : Emmanuel Coquery

Résumé :

En raison de l’architecture décentralisée du Linked Open Data (LOD), répondre à des requêtes complexes nécessite souvent l’accès à plusieurs sources de données et la combinaison des informations qu’elles retournent. Cette thèse s’intéresse à l’évaluation des requêtes destinées au LOD exprimées à l’aide du langage SPARQL. Le traitement de ces requêtes nécessite la communication avec plusieurs sources distantes, car les informations pertinentes à ces requêtes sont reparties sur plusieurs sources disponibles sur le Web des données (WoD). Pour construire la réponse finale, une combinaison des résultats intermédiaires renvoyés par chacune de ces sources est nécessaire. Dans ce contexte, l’objectif de ce travail est de concevoir un système qui aura pour entrée une requête SPARQL et qui retourne en réponse un résultat produit par l’agrégation de plusieurs fragments en provenance de diverses sources. Tout cela en toute transparence pour l’utilisateur afin de lui éviter de spécifier les sources susceptibles de contenir la réponse à sa requête. Un tel système doit faire face à deux défis majeurs : d’une part, les problématiques liées à la sélection des sources pertinentes contenant potentiellement les informations désirées. D’autre part, lors de la combinaison des résultats, il peut y avoir des redondances et des chevauchements de données dus à la disponibilité de la même information dans plusieurs sources.