Thèse de Steeven Janny


Sujet :
Incorporation d’a priori physique pour l’apprentissage profond

Résumé :

Les dernières années ont été marquées par l’essor du Machine Learning (ML), qui a permis des gains en performances significatifs dans plusieurs domaines d'application. Outre les progrès méthodologiques indéniables, ces gains sont souvent attribués à des grandes quantités de données d'entraînement et à la puissance de calcul, qui ont conduit à des avancées dans la reconnaissance de la parole, la vision par ordinateur et le traitement automatique de la langue (je mettrai de l’informations en generale).

 

Alors que dans de nombreuses applications, l'apprentissage automatique est devenu la méthodologie prédominante, ils existent également des domaines et/ou des situations où la modélisation exacte d’un système ou d’un phénomène reste (à l’heure actuelle) indispensable. Cette dichotomie entre conception manuelle (en intégrant les connaissances métiers) et apprentissage automatique à partir de données est typique de l'intelligence artificielle à son interface avec d'autres domaines. Elle est largement discutée, par exemple, en vision par ordinateur (caractéristiques conçues manuellement vs. caractéristiques apprises) en traitement automatique de la langue (connaissances linguistiques vs. apprentissage), en statistique (modèles de causalité vs. prédicteurs appris) et en automatique (théorie du contrôle vs. apprentissage par renforcement) etc.

 

Cette thèse se place dans un contexte de problèmes impliquants des phénomènes physiques, tels que le contrôle de processus mécaniques ou d’agents mécaniques, traditionnellement abordés par la théorie du contrôle, ou la prédiction météo, traditionnellement traitée par une modélisation numérique basée sur des équations aux dérivées partielles (EDP), sur une discrétisation sous  forme de grille, etc. La plupart des phénomènes physiques sont régis par des systèmes à dimension infinie (Navier-Stockes pour la mécanique des fluides, Maxwell pour l’électromagnétisme, équation de la chaleur etc…). La modélisation de ces phénomènes naturels reste une discipline pour laquelle les méthodes “data-driven” souffrent d’un manque de précision, de stabilité et de robustesse des schémas de discrétisation souvent nécessaires pour leurs implémentations en pratique.

 

En abordant ce problème de manière hybride, combinant la modélisation des phénomènes physiques étudiées et l’apprentissage automatique à partir de données massives, nous adresserons les questions méthodologiques sous-jacentes.


Encadrant : Christian Wolf