Thèse de Tarek Sayah

Sujet :

Spécification et gestion de politiques de contrôle d'accès dans un environnement d'accès aux données distribuées.

Date de début : 16/09/2013
Date de soutenance : 08/09/2016

Encadrant : Mohand-Said Hacid

Résumé :

L’émergence du Web Sémantique a mené à une adoption rapide du format RDF (Resource Description Framework) pour décrire les données et les liens entre elles. Le modèle de graphe de RDF est adapté à la représentation des liens sémantiques entre les objets du Web qui sont identifiés par des IRI (Internationalized Resource Identifier). Les applications qui publient et échangent des données RDF potentiellement sensibles augmentent dans de nombreux domaines : bio-informatique, e-gouvernement, mouvements open-data. La problématique du contrôle des accès aux contenus RDF et de l'exposition sélective de l'information en fonction des privilèges des requérants devient de plus en plus importante. Une réponse à la problématique est particulièrement attendue dans le contexte de l'open-data, car elle encouragerait les fournisseurs de données à publier des données au public selon leurs propres termes, de façon sélective.
Deux verrous scientifiques justifient un travail de recherche pour l'élaboration d'une réponse aux problèmes de l'exposition sélective des données RDF distribuées. Le premier verrou est celui de la distribution des sources de données et des autorités qui les contrôlent. Le contexte naturellement ouvert de l'échange des données RDF rend peu réaliste les hypothèses de confiance réciproque ou d'authentification unique et partagée, il faut donc proposer des mécanismes innovants pour l'identification des utilisateurs et l'intégration de politiques de sécurité édictées par des autorités différentes. Les problèmes d'exécution des requêtes distribuées prenant en compte le filtrage sont également à prendre en considération. Le second verrou est celui posé par l'introduction des mécanismes de déduction pour les données RDF (e.g., RDF/S, OWL). En effet, quand un propriétaire souhaite interdire l'accès à une information, il faut également s'assurer que les données diffusées ne pourront pas permettre de déduire l'information supposée secrète par l'intermédiaire des mécanismes d'inférence RDF.
Un premier travail de veille scientifique conduira à l'élaboration de critères d'évaluation de l'état de l'art sur le contrôle d'accès aux données RDF, dont notamment l’expressivité du langage de spécification de politique, la résolution des conflits générés par des règlements aux décisions contradictoires et la vérification des inférences non-autorisées. Les outils envisagés pour lever les verrous sus-mentionnés incluent l'analyse statique des requêtes pour RDF en présence d'inférence, dont en particulier le problème de l'inclusion de requêtes, les outils d'intégration de données et de mapping de schémas ainsi que les modèles déclaratifs de contrôle d'accès distribués.