Thèse de Yulian Yang


Sujet :
Les réseaux logiques sémantiques pour Recherche d'Information une plate-forme pair-à-pair

Date de soutenance : 28/03/2014

Encadrant : Sylvie Calabretto

Résumé :

Nous considérons une plate-forme pair-à-pair pour la Recherche d'Information (RI) collaborative. Chaque pair héberge une collection de documents textuels qui traitent de ses sujets d'intérêt. En l'absence d'un mécanisme d'indexation global, les pairs indexent localement leurs documents et s'associent pour fournir un service distribué de réponse à des requêtes. Notre objectif est de concevoir un protocole décentralisé qui permette aux pairs de collaborer an de transmettre une requête depuis son émetteur jusqu'aux pairs en possession de documents pertinents.
Les réseaux logiques sémantiques (Semantic Overlay Networks, abbr. SON) représentent la solution de référence de l'état de l'art. Dans les SONs, les pairs qui possèdent des ressources sémantiques similaires sont regroupés en clusters. Les opérations de RI seront alors effi caces puisqu'une requête sera transmise aux clusters de pairs qui hébergent les ressources pertinentes. La plupart des approches actuelles consistent en une reconguration dynamique du réseau de pairs (peer rewiring). Pour ce faire, chaque pair exécute périodiquement un algorithme de marche aléatoire sur le réseau pair-à-pair an de renouveler les pairs de son cluster. Ainsi, un réseau à la structure initialement aléatoire évolue progressivement vers un réseau logique sémantique.
Jusqu'à présent, les approches existantes n'ont pas considéré que l'évolution de la topologie du réseau puisse influer sur les performances de l'algorithme de reconguration dynamique du réseau. Cependant, s'il est vrai que, pour une configuration initiale aléatoire des pairs, une marche aléatoire sera efficace pour découvrir les pairs similaires, lorsque des clusters commencent à émerger une approche gloutonne devient alors mieux adaptée. Ainsi, nous proposons une stratégie mixe qui applique un algorithme de recuit simulé (Simulated Annealing, abbr. SA) afin de faire évoluer une stratégie de marche aléatoire vers une stratégie gloutonne lors de la construction du SON. Les résultats de nos évaluations montrent que cette stratégie améliore les approches actuelles aussi bien pour la performance de la construction du SON que pour la pertinence des résultats retournés aux requêtes circulant sur le réseau pair-à-pair.
Cette thèse contient plusieurs avancées concernant l'état de l'art dans ce domaine. D'abbord, nous modélisions formellement la reconguration dynamique d'un réseau en un SON. Nous identions un schéma générique pour la reconguration d'un réseau pair-à-pair, et après le formalisons en une procédure constituée de trois étapes. Ce framework cohérent offre à ses utilisateurs (i.e. concepteurs du réseau) de quoi le paramétrer. Ensuite, le problème de la construction d'un SON est modélisé sous la forme d'un problème d'optimisation combinatoire pour lequel les opérations de reconguration du réseau correspondent à la recherche décentralisée d'une solution locale. Fondée sur ce modèle, une solution concrète à base de recuit simulé est proposée. Nous menons une étude expérimentale poussée sur la construction du SON et la RI sur SONs, et validions notre approche.