Thèse de Mattéo Clémot


Sujet :
Calcul accéléré de descripteurs topologiques pour l'analyse de nuages de points

Date de début : 01/10/2023
Date de fin (estimée) : 01/10/2026

Encadrant : Julie Digne
Co-encadrant : Julien Tierny

Résumé :

L'analyse topologique des données (TDA) est une famille d'outils mathématiques développés pour mettre en évidence de manière robuste les structures implicites présentes dans des ensembles de données. Parmi ces outils, l'homologie persistante revêt une importance particulière. Elle fournit une description multi-échelle des caractéristiques topologiques – telles que les composantes connexes, les cycles ou les cavités – présentes dans un ensemble de données. Ces informations sont souvent résumées sous forme de descripteurs concis, comme les diagrammes de persistance. Cependant, le calcul de ces descripteurs peut souvent s'avérer coûteux en temps et en mémoire. Cette thèse aborde deux principaux défis : exploiter ces descripteurs dans un contexte d'analyse de données, notamment pour améliorer la préservation des structures topologiques lors des processus de réduction de dimension ; et concevoir des algorithmes permettant de calculer efficacement ces descripteurs topologiques en exploitant des hypothèses spécifiques sur les données. À cette fin, nous proposons d'abord une nouvelle approche de réduction de dimension qui s'appuie sur les Topological Autoencoders, en proposant une nouvelle formulation visant à favoriser la préservation des cycles de haute dimension. Nous montrons que ces derniers sont effectivement préservés – quand c'est possible – qualitativement (pas d'auto-intersections) et quantitativement (préservation des diagrammes de persistance pour la distance de Wasserstein). De plus, nous proposons un algorithme spécialisé dans le calcul de la persistance de Rips d'ensembles de points planaires, permettant une accélération substantielle de la méthode. Ensuite, nous nous intéressons à la filtration de Delaunay–Rips pour les ensembles de points de faible dimension. En particulier, nous étudions les instabilités qu'elle engendre dans les diagrammes de persistance lorsque les données sont perturbées, et concevons un algorithme dédié qui tire parti de la structure spécifique de cette filtration. Enfin, nous abordons l'homologie persistante à deux paramètres, un champs de recherche récent visant à améliorer la robustesse aux valeurs aberrantes. Nous proposons une adaptation de la Flood filtration à ce contexte à deux paramètres, permettant un calcul rapide des descripteurs associés. Nous évaluons notre construction sur des tâches de classification sur des ensembles de données synthétiques et sur des séries temporelles.


Jury :
Alexandra BacMaître de conférencePolytech MarseilleRapporteur(e)
Michael KerberProfesseur(e)TU GrazRapporteur(e)
Raphaëlle ChaineProfesseur(e)Université Lyon 1Examinateur​(trice)
Erin ChambersProfesseur(e)University of Notre DameExaminateur​(trice)
Nicolas CourtyProfesseur(e)Université Bretagne SudExaminateur​(trice)
Théo LacombeMaître de conférenceUniversité Gustave EiffelExaminateur​(trice)
Julie DigneDirecteur(trice) de rechercheCNRSDirecteur(trice) de thèse
Julien TiernyDirecteur(trice) de rechercheCNRSDirecteur(trice) de thèse