Thèse de Guillaume Bosc


Sujet :
Formalisation et mise en œuvre de méthodes heuristiques de fouille de données massives et hétérogènes

Date de soutenance : 11/09/2017

Encadrant : Jean-Francois Boulicaut
Co-encadrant : Mehdi Kaytoue

Résumé :

Ce travail de thèse porte sur l'élaboration et l'expérimentation de nouvelles méthodes génériques de fouille de motifs mathématiquement fondées. Étant donnés un langage de motifs et une base de données définie sur le même langage, on cherche à extraire la collection de motifs qui vérifie un ensemble de contraintes données, qui soit complète, correcte et avec le moins de redondance possible. Cependant, les méthodes actuelles de fouille de motifs ne sont pas encore adaptées au contexte des données à la fois massives et hétérogènes, du fait des fortes contraintes d’exactitude et de complétude que la collection de motifs doit vérifier.
Dans ce sujet de thèse, on propose alors d'étudier le problème d'énumération de motifs, à partir de données potentiellement massives et hétérogènes, sous un nouveau point de vue selon deux angles: (i) un parcours heuristique de l'espace de recherche, mais avec des garanties, et (ii) une utilisation jointe de langages de motifs d'expressivité différente.