HDR de Khalid Benabdeslem
Sujet :
Résumé :
L’ensemble des activités de recherche décrites dans cette HDR s’inscrit dans le cadre de l’apprentissage semi-supervisé, au sens large, pour l’extraction de connaissances à partir de données. Dans cette thématique, on s’intéresse à l’analyse de données partiellement étiquetées qui peut être abordée selon deux grandes familles d’approches. La première est basée sur la propagation de la supervision, en vue de l’apprentissage supervisé. La seconde est fondée sur la transformation des données étiquetées en contraintes pour leur intégration dans un processus non-supervisé. Les travaux de cette HDR s’inscrivent dans la deuxième famille d’approches avec une difficulté particulière. Il s’agit d’apprendre à partir de données dont la partie étiquetée est relativement réduite par rapport à la partie non-étiquetée. Pour ce faire, je me suis particulièrement intéressé aux modèles topologiques basés sur les cartes auto-organisatrices d’une part, et aux modèles graphiques basés sur la coloration et l’analyse spectrale de graphes d’autre part. M’appuyant sur ces modèles, j’ai essayé de répondre à plusieurs questions qui sont souvent posées dans les communautés d’apprentissage automatique et de fouille de données, et qui demeurent toujours d’actualité. Les réponses à ces questions se traduisent par quelques contributions qui constituent le cœur de cette HDR : (1) modélisation graphique des cartes topologiques, (2) classification topologique sous contraintes et (3) sélection de variables en mode semi-supervisé.
Date de soutenance : vendredi, 20 juin, 2014