Thèse de Ataollah Kamal


Sujet :
Méthodes d’Explication Basées sur la Théorie des Jeux pour les Réseaux de Neurones Graphiques

Date de début : 01/09/2022
Date de fin (estimée) : 01/09/2025

Encadrant : Céline Robardet
Co-encadrant : Marc Plantevit

Résumé :

Les réseaux de neurones graphiques (GNNs) ont connu un succès remarquable dans un large éventail d'applications. Cependant, la complexité de leurs architectures les rend difficiles à interpréter, ce qui limite leur adoption dans des domaines critiques où la transparence est essentielle. Bien que de nombreuses méthodes d’explication aient été proposées pour les GNNs, la plupart ne disposent pas de garanties théoriques quant à la fidélité et à la fiabilité de leurs résultats. Parmi ces méthodes, les approches basées sur la théorie des jeux se distinguent en offrant des garanties formelles, fondées sur des axiomes bien établis.

La plupart des méthodes issues de la théorie des jeux considèrent les composantes d’entrée (par exemple, les nœuds ou les arêtes) comme des joueurs, et calculent leur contribution dans un jeu coopératif en utilisant des concepts de solution tels que les valeurs de Shapley ou les HN-values. Toutefois, le calcul exact de ces contributions est exponentiel en fonction du nombre de joueurs, ce qui rend les solutions exactes irréalisables d’un point de vue computationnel pour les grands graphes. Par conséquent, des méthodes d’approximation sont souvent employées. Néanmoins, à mesure que la taille du graphe d’entrée augmente, la qualité de ces approximations se dégrade, compromettant ainsi la fiabilité des explications.

Pour relever ces défis, cette thèse propose deux solutions complémentaires. Premièrement, nous introduisons une méthode appelée INSIDE-SHAP, qui utilise des règles d’activation, dérivées des représentations cachées des GNNs, comme joueurs dans le jeu coopératif. INSIDE-SHAP découple la taille de l’ensemble des joueurs de celle du graphe d’entrée, permettant ainsi un calcul plus efficace des contributions basées sur les valeurs de Shapley, sans compromettre les garanties théoriques. Deuxièmement, nous présentons un nouveau cadre théorique, ESPAM, basé sur des axiomes alternatifs, distincts de ceux qui sous-tendent les valeurs de Shapley. Ce cadre permet un calcul exact des valeurs de contribution en temps polynomial, éliminant ainsi le besoin d’approximation tout en préservant les dépendances structurelles au sein du graphe. De plus, la méthode proposée est indépendante du modèle, ce qui renforce son applicabilité à diverses architectures de GNNs.

Enfin, nous démontrons l’utilité pratique de ESPAM en l’appliquant à un modèle GNN complexe pour la prédiction des interactions molécule–médicament. Ensemble, ces contributions font progresser le développement de méthodes d’explication évolutives, fidèles et théoriquement fondées pour les modèles de GNN.


Jury :
IENCO Dino Directeur(trice) de rechercheINRAERapporteur(e)
LABROCHE NicolasProfesseur(e)LIFATRapporteur(e)
GALARRAGA LuisChargé(e) de RechercheINRIAExaminateur​(trice)
BEN MOKHTAR SoniaDirecteur(trice) de rechercheCNRSExaminateur​(trice)
ROBARDET CelineProfesseur(e)INSA Lyon Directeur(trice) de thèse
PLANTEVIT MarcProfesseur(e)EPITACo-directeur (trice)