Thèse de Valentin Cuzin-Rambaud
Sujet :
Date de début : 01/10/2025
Date de fin (estimée) : 01/10/2028
Encadrant : Maxime Morge
Co-encadrant : Laetitia Matignon
Résumé :
Cette thèse s'intéresse à l'apprentissage par renforcement multi-agent (MARL) dans des environnements dynamiques et partiellement observables, où la coordination décentralisée est essentielle. Les approches classiques de type CTDE (Centralized Training with Decentralized Execution) supposent une communication parfaite lors de l'entraînement, une hypothèse peu réaliste dans des systèmes réels soumis à des contraintes de communication et de ressources. L'objectif est de développer un cadre d'apprentissage décentralisé, hiérarchique et transférable, permettant aux agents de : communiquer de manière adaptative, coordonner leurs comportements malgré une observabilité limitée, transférer leurs compétences vers de nouvelles tâches, configurations d'agents ou structures de communication, dans une perspective d'apprentissage continu.