Thèse de Alice Janela Cameijo


Sujet :
Méthodes d’apprentissage automatique / profond pour la propagation d’ondes infrasonores dans la moyenne atmosphère : mise en œuvre, évaluation et optimisation

Date de début : 20/11/2023
Date de fin (estimée) : 20/11/2026

Encadrant : Samir Aknine

Résumé :

Le CEA DAM exploite en routine les données du SSI (Système de Surveillance International) mis en place dans le cadre de la vérification du TICE (Traité d'Interdiction Complète des Essais nucléaires). Pour répondre à sa mission de surveillance, des méthodes de détection et de simulation de la propagation d’ondes infrasonores dans la moyenne atmosphère (MA, 15-100 km) sont développées afin de localiser précisément et caractériser finement des sources d’intérêt (https://www-dase.cea.fr/). Exploités dans un mode de fonctionnement continu, les réseaux actuels constituent un système innovant et efficace pour la surveillance de risques naturels et le sondage de la MA dans des gammes d’altitudes où les observations sont rares et irrégulièrement échantillonnées  .

La MA revêt depuis une dizaine d’années un rôle essentiel dans la communauté scientifique et notamment météorologique. Une dynamique de recherche est en place depuis plusieurs années pour améliorer la représentation physique des processus de couplage entre les différentes couches atmosphériques à des altitudes où les diagnostics des champs météorologiques sont parcellaires. Les récentes avancées dans les méthodes de simulation développées au CEA DAM permettent de mieux intégrer des modèles opérationnels d’atmosphère tels ceux fournis par Centre Européen pour les Prévisions Météorologiques à Moyen Terme (CEPMMT, ou ECMWF en anglais). La variabilité de ces modèles à différentes échelles spatiales et temporelles et leurs incertitudes associées impactent fortement la propagation des ondes infrasonores.

Pour mener à bien les missions de surveillance du CEA DAM, un enjeu majeur est l’évaluation précise et rapide des seuils de détection et l’interprétation fine des signaux générés par des sources d’intérêt. Le coût en calcul des méthodes numériques de simulation de la propagation, comme les modes normaux ou les équations paraboliques (PE), ne permet pas à ce jour l'exploration d'un large espace de paramètres (variations des états atmosphériques, représentation de leur variabilité à petite échelle, fréquence et emplacement de la source) pour la prédiction des pertes par transmission (TLs), les rendant inapplicables pour des applications en temps quasi-réel. Pour réduire les temps de calcul, des approches s'appuyant sur des modélisations heuristiques de l’atténuation des ondes ont été développées  . Cependant, les résultats fournis par ces codes sont loin des capacités offertes par les plateformes numériques qui tiennent compte des incertitudes, qu’elles soient associées aux modèles physiques, aux schémas numériques ou aux données d’entrée des codes. De nombreux acteurs académiques s’intéressent à l’apport des méthodes d’intelligence artificielle pour l’analyse de données et la construction de modèles dans différents domaines scientifiques. En particulier, des méthodes d’apprentissage sont actuellement explorées par des instituts partenaires (NORSAR  ), ouvrant la voie à l’application de méthodes d’apprentissage profond pour la prédiction des TLs.
Objectifs : 
La modélisation précise de la distribution spatiale des pertes par transmission est essentielle pour caractériser les paramètres de la source des signaux détectés. Les techniques d’apprentissage explorées reposent sur des réseaux de neurones convolutifs de type CNN (Convolutional Neural Networks), entraînés sur un large ensemble de champs d'ondes simulés à l’échelle régionale. Ce nouveau cadre de modélisation conduit à une estimation rapide des TLs (erreur de ∼5 dB, par rapport aux simulations PE) avec des temps de calcul négligeables (de l’ordre de 0,05 s). Si ces résultats sont prometteurs, la distance maximale de propagation fixée à 1000 km ne permet pas des applications à l'échelle globale  . De plus, la causalité du processus de propagation des ondes selon laquelle les TLs à une distance donnée de la source ne dépendent pas des états atmosphériques au-delà de ce point n'a pas été prise en compte.
 L’objectif de la thèse est de développer des méthodes d’apprentissage profond pour réaliser une estimation rapide du champ d’onde propagé à l’échelle globale dans des états réalistes d’atmosphère. On poursuivra dans un premier temps l’étude publiée par NORSAR en optimisant les méthodes déjà implémentées. Des techniques avancées du domaine de l’intelligence artificielle seront ensuite explorées. Les architectures étudiées exploiteront des réseaux de type RNN (Recurrent Neural Networks) qui prennent en compte la notion de temporalité inhérente aux données manipulées. Elles seront entrainées sur de larges ensembles de scénarios représentatifs de conditions réelles de propagation. Par ailleurs, l’apport d’opérateurs de neurones, tels que les FNO (Fourier Neural Operator), PINO (Physics-Informed Neural Operator) et GNO (Graph Neural Operator), pour guider les processus d’apprentissage par des lois physiques, sera évalué. Ces approches seront adaptées à la résolution des équations aux dérivées partielles (EDPs) dans un espace de fonction de dimensions finies ou infinies de propagation des ondes dans un milieu hétérogène. La mise en œuvre de ces nouvelles méthodes ouvrira la voie à une surveillance des sources explosives à l’échelle globale et à de méthodes de diagnostic de la dynamique atmosphérique en temps quasi-réel afin de répondre aux attentes opérationnelles du CEA DAM. 
Le cadre de la thèse mobilisera l’expertise du Centre National de Données (CND) hébergé au CEA DAM pour l’exploitation des données du SSI en termes d’outils de détection et de simulation de la propagation. La collaboration étroite avec des partenaires européens sur la thématique IA a déjà permis de démontrer le potentiel des méthodes d’apprentissage pour répondre aux objectifs de la thèse. L’encadrement de la thèse assurera la pertinence des orientations méthodologiques