Thèse de Valentin Cuzin-Rambaud

Sujet :

Apprentissage par renforcement multi-agents hiérarchique et transférable : une approche basée sur la communication et les représentations graphiques

Date de début : 01/10/2025
Date de fin (estimée) : 01/10/2028

Encadrant : Maxime Morge
Co-encadrant : Laetitia Matignon

Résumé :

Cette thèse s'intéresse à l'apprentissage par renforcement multi-agent (MARL) dans des environnements dynamiques et partiellement observables, où la coordination décentralisée est essentielle. Les approches classiques de type CTDE (Centralized Training with Decentralized Execution) supposent une communication parfaite lors de l'entraînement, une hypothèse peu réaliste dans des systèmes réels soumis à des contraintes de communication et de ressources. L'objectif est de développer un cadre d'apprentissage décentralisé, hiérarchique et transférable, permettant aux agents de : communiquer de manière adaptative, coordonner leurs comportements malgré une observabilité limitée, transférer leurs compétences vers de nouvelles tâches, configurations d'agents ou structures de communication, dans une perspective d'apprentissage continu.