Thèse de Pierre-Nicolas Mougel


Sujet :
Algorithmes de data mining pour l'étude de systèmes dynamiques : étude de la fouille d'hypercubes booléens pour l'analyse de réseaux d'interactions

Date de soutenance : 01/09/2012

Encadrant : Christophe Rigotti

Résumé :

L'équipe Modélisation et Découverte de Connaissances poursuit des
recherches amont sur les méthodes et algorithmes de data mining. De
nouveaux défis accompagnent ses ouvertures vers l'étude des systèmes
complexes (en relation avec l'Institut Rhône-Alpin IXXI), notamment en
informatique bio-inspirée (réseaux de neurones, algorithmes génétiques)
et pour la biologie in silico. Dans le cadre de cette thèse, nous
proposons de développer des concepts et des méthodes de fouille de
données pour l'étude de systèmes dynamiques, qu'ils soient artificiels
(e.g., des simulations d'interactions protéines-protéines) ou réels
(e.g., des données expérimentales sur la dynamique de l'expression des
gènes dans une cellule ou encore des données décrivant des interactions
sociales). Le point de départ de ce travail va être d'étudier les
analogies entre les méthodes complètes d'extraction de motifs dans de
grandes matrices booléennes (un des domaines d'expertise de notre
équipe) et la recherche de régularités dans des grands graphes ou dans
des collections de graphes. Le fait que l'on souhaite travailler sur des
graphes dynamiques ou décrivant une dynamique, nous conduit
naturellement à envisager l'utilisation d'hypercubes booléens (ajout de
la dimension temporelle et/ou de dimensions décrivant les attributs des
sommets et des arcs). Un autre axe de travail prometteur sera d'étudier
les spécificités des graphes considérés (notamment les graphes
d'interactions), et de tirer parti des propriétés des types de motifs
que ces graphes peuvent contenir (e.g., motifs tolérants aux
exceptions).