Thèse de Farouk Damoun


Sujet :
Federated learning and graph neural networks

Résumé :

Avec le besoin de respecter le règlement général de la protection des données portant sur la manière

dont les entreprises et autres organisations doivent se comporter vis-à-vis des données personnelles,

les entreprises du monde entier s’intéressent à la technique du Federated Learning (l’Apprentissage

Fédéré - FL) et aux différents cas d'utilisation des modèles d’apprentissage automatique basés sur des

données massives.




L'objectif du présent projet de recherche doctorale se concentre sur la préservation de la confidentialité

des données en utilisant les techniques du FL pour différents cas d’utilisation de données relatives à la

sécurité, aux hôpitaux et aux banques. Plus précisément, par l'utilisation des “graph neural networks”

(GNN), qui permet d'analyser des données dans un espace non euclidien pour apprendre d'une autre

perspective des données.




Le projet se concentre sur l'amélioration des techniques d’Embedding de l'état de l'art pour les réseaux

hétérogènes attribués (Heterogeneous Attributed Networks - HAN) dans l’objectif est de fournir une

inférence contextuelle relative au cas d’étude. D'un autre côté, nous devons préserver la vie privée des

personnes (clients ou utilisateurs) conformément aux nouvelles réglementations établies par la

CNPD/GDPR (Commission Nationale pour la Protection des Données).




En outre, le projet vise à développer diverses architectures GNN afin de maximiser l'utilisation de la

structure de données et des attributs des graphes pour étendre l'utilisation des embeddings de graphes

pour analyser les comportements et les relations entre les différentes entités, par une approche qui se

base sur des architectures GNN hybride (spatiale/spectrale), pour exploiter pleinement et

simultanément les données spectrales et spatiales. Le but est de pouvoir analyser des données de

graphes dans les secteurs qui comportent des données sensibles. Ce travail favorisera la recherche

d'algorithmes combinés entre les opérations de convolution (Convolutional network) et les réseaux

neuronaux peu profonds (Shallow network) pour les représentations spatiales et spectrales des

graphes dans l’analyse d’Embedding pour booster les tâches liées à l'apprentissage automatique. Notre

travail sera étendu à l'apprentissage fédéré, ce qui va promouvoir la recherche sur l'apprentissage

collaboratif avec la préservation de la vie privée des clients/utilisateurs dans les institutions où les

données contiennent des informations sensibles sur des personnes.


Encadrant : Hamida Seba