Thèse de Ataollah Kamal


Sujet :
On GNN Explainability

Date de début : 01/09/2022
Date de fin (estimée) : 01/09/2025

Encadrant : Céline Robardet

Résumé :

Les graphes sont une structure de données puissante très utilisée pour représenter des données relationnelles. L'une de leurs spécificités est que leur structure sous-jacente n'est pas dans un espace Euclidien et n'a pas une structure en forme de grille, caractéristiques facilitant l'utilisation directe de techniques génériques d'apprentissage automatique. En effet, chaque nœud d'un graphe est caractérisé par un label, ses nœuds voisins et récursivement leurs propriétés. Ces informations intrinsèquement discrètes ne peuvent pas être directement utilisées par des méthodes d'apprentissage automatique standard pour prédire une classe associée au graphe ou à un de ses nœuds. Ainsi, les réseaux de neurones pour graphes (GNN) apprennent des vecteurs    représentant chaque nœud v dans un espace métrique afin de permettre la comparaison entre nœuds. Les GNN utilisent une stratégie de propagation de messages qui agrège récursivement les informations des nœuds vers leurs voisins afin de produire des représentations vectorielles de l'ego-graphe centrées sur un nœud v -- avec un rayon égal à l'indice de récursivité -- de telle sorte que la tâche de classification, basée sur ces vecteurs, soit optimisée. L'objectif de cette thèse est de proposer de nouvelles méthodes pour l'explication de modèles profonds de graphes (GNN). Plusieurs pistes pourront être explorées. (1) Le développement de méthodes dédiées à l'explications de GNN appris sur un unique graphe, (2) Considérer de nouveaux modèles (e.g., modèles à attention), (3) définir de nouveaux types de motifs d'activation et des méthodes dédiées pour les approximer rapidement, (4) une méthode à base d'auto-encodeur variationnel pour générer des explications.