Thèse de Farouk Damoun
Sujet :
Date de début : 02/11/2021
Date de fin : 02/11/2024
Encadrant : Hamida Seba
Résumé :
Avec le besoin de respecter le règlement général de la protection des données portant sur la manière
dont les entreprises et autres organisations doivent se comporter vis-à-vis des données personnelles,
les entreprises du monde entier s’intéressent à la technique du Federated Learning (l’Apprentissage
Fédéré - FL) et aux différents cas d'utilisation des modèles d’apprentissage automatique basés sur des
données massives.
L'objectif du présent projet de recherche doctorale se concentre sur la préservation de la confidentialité
des données en utilisant les techniques du FL pour différents cas d’utilisation de données relatives à la
sécurité, aux hôpitaux et aux banques. Plus précisément, par l'utilisation des “graph neural networks”
(GNN), qui permet d'analyser des données dans un espace non euclidien pour apprendre d'une autre
perspective des données.
Le projet se concentre sur l'amélioration des techniques d’Embedding de l'état de l'art pour les réseaux
hétérogènes attribués (Heterogeneous Attributed Networks - HAN) dans l’objectif est de fournir une
inférence contextuelle relative au cas d’étude. D'un autre côté, nous devons préserver la vie privée des
personnes (clients ou utilisateurs) conformément aux nouvelles réglementations établies par la
CNPD/GDPR (Commission Nationale pour la Protection des Données).
En outre, le projet vise à développer diverses architectures GNN afin de maximiser l'utilisation de la
structure de données et des attributs des graphes pour étendre l'utilisation des embeddings de graphes
pour analyser les comportements et les relations entre les différentes entités, par une approche qui se
base sur des architectures GNN hybride (spatiale/spectrale), pour exploiter pleinement et
simultanément les données spectrales et spatiales. Le but est de pouvoir analyser des données de
graphes dans les secteurs qui comportent des données sensibles. Ce travail favorisera la recherche
d'algorithmes combinés entre les opérations de convolution (Convolutional network) et les réseaux
neuronaux peu profonds (Shallow network) pour les représentations spatiales et spectrales des
graphes dans l’analyse d’Embedding pour booster les tâches liées à l'apprentissage automatique. Notre
travail sera étendu à l'apprentissage fédéré, ce qui va promouvoir la recherche sur l'apprentissage
collaboratif avec la préservation de la vie privée des clients/utilisateurs dans les institutions où les
données contiennent des informations sensibles sur des personnes.