Thèse de Hoang Viet Tuan Nguyen


Sujet :
Prise en compte de la qualité des données lors de l’extraction et de la sélection d’évolutions dans les séries temporelles de champs de déplacements en imagerie satellitaire

Date de soutenance : 10/10/2018

Encadrant : Nicolas Meger
Co-direction : Catherine Pothier, Christophe Rigotti, Emmanuel Trouve

Résumé :

Ce travail de thèse traite de la découverte de connaissances à partir de Séries Temporelles de Champs de Déplacements (STCD) obtenues par imagerie satellitaire. De telles séries oc- cupent aujourd’hui une place centrale dans l’étude et la surveillance de phénomènes naturels tels que les tremblements de terre, les éruptions volcaniques ou bien encore le déplacement des glaciers. En effet, ces séries sont riches d’informations à la fois spatiales et temporelles et peuvent aujourd’hui être produites régulièrement à moindre coût grâce à des programmes spatiaux tels que le programme européen Copernicus et ses satellites phares Sentinel. Nos propositions s’appuient sur l’extraction de motifs Séquentiels Fréquents Groupés (SFG). Ces motifs, à l’origine définis pour l’extraction de connaissances à partir des Sé- ries Temporelles d’Images Satellitaires (STIS), ont montré leur potentiel dans de premiers travaux visant à dépouiller une STCD. Néanmoins, ils ne permettent pas d’utiliser les indices de confiance intrinsèques aux STCD et la méthode de swap randomisation employée pour sélectionner les motifs les plus prometteurs ne tient pas compte de leurs complémentarités spatiotemporelles, chaque motif étant évalué individuellement. Notre contribution est ainsi double. Une première proposition vise tout d’abord à asso- cier une mesure de fiabilité à chaque motif en utilisant les indices de confiance. Cette mesure permet de sélectionner les motifs portés par des données qui sont en moyenne suffisam- ment fiables. Nous proposons un algorithme correspondant pour réaliser les extractions sous contrainte de fiabilité. Celui-ci s’appuie notamment sur une recherche efficace des occurrences les plus fiables par programmation dynamique et sur un élagage de l’espace de recherche grâce à une stratégie de push partiel, ce qui permet de considérer des STCD conséquentes. Cette nouvelle méthode a été implémentée sur la base du prototype existant SITS-P2miner, déve- loppé au sein du LISTIC et du LIRIS pour extraire et classer des motifs SFG. Une deuxième contribution visant à sélectionner les motifs les plus prometteurs est égale- ment présentée. Celle-ci, basée sur un critère informationnel, permet de prendre en compte à la fois les indices de confiance et la façon dont les motifs se complètent spatialement et tem- porellement. Pour ce faire, les indices de confiance sont interprétés comme des probabilités, et les STCD comme des bases de données probabilistes dont les distributions ne sont que par- tielles. Le gain informationnel associé à un motif est alors défini en fonction de la capacité de ses occurrences à compléter/affiner les distributions caractérisant les données. Sur cette base, une heuristique est proposée afin de sélectionner des motifs informatifs et complémentaires. Cette méthode permet de fournir un ensemble de motifs faiblement redondants et donc plus faciles à interpréter que ceux fournis par swap randomisation. Elle a été implémentée au sein d’un prototype dédié. Les deux propositions sont évaluées à la fois quantitativement et qualitativement en uti- lisant une STCD de référence couvrant des glaciers du Groenland construite à partir de données optiques Landsat. Une autre STCD que nous avons construite à partir de données radar TerraSAR-X couvrant le massif du Mont-Blanc est également utilisée. Outre le fait d’être construites à partir de données et de techniques de télédétection différentes, ces séries se différencient drastiquement en termes d’indices de confiance, la série couvrant le massif du Mont-Blanc se situant à des niveaux de confiance très faibles. Pour les deux STCD, les méthodes proposées ont été mises en œuvre dans des conditions standards au niveau consom- mation de ressources (temps, espace), et les connaissances des experts sur les zones étudiées ont été confirmées et complétées.


Jury :
Mme TUPIN FlorenceProfesseur(e)Télécom ParisTechPrésident(e)
Mme FROMONT ElisaProfesseur(e)Université de Rennes 1Rapporteur(e)
M. CREMILLEUX BrunoUniversité de Caen NormandieRapporteur(e)
M. IENCO DinoChargé(e) de RechercheIRSTEAExaminateur​(trice)
M. MEGER NicolasMaître de conférenceUniversité Savoie Mont BlancDirecteur(trice) de thèse
M. RIGOTTI ChristopheMaître de conférenceINSA LyonCo-directeur (trice)
Mme POTHIER CatherineMaître de conférenceINSA LyonCo-directeur (trice)
M. TROUVE EmmanuelProfesseur(e)Université Savoie Mont BlancCo-directeur (trice)