Thèse de Simon Pageaud


Sujet :
Architecture générique pour la co-construction de politiques urbaines basée sur l’apprentissage par renforcement multi-agent

Résumé :

La thèse s'intéresse au couplage de la simulation multi-agents et l'apprentissage multi-agents par renforcement profond pour proposer un système (SmartGov) de co-construction participative de politiques urbaine, en mettant les acteurs de la ville dans la boucle de conception dès le début du processus d'élaboration des politiques.
La Smart City offre la possibilité d’intégrer les données collectées par les capteurs présents dans la ville pour la modéliser de facçon réaliste. Notre première contribution est une architecture générique pour construire une simulation multi-agents représentant la ville, et étudier l’ émergence de comportements globaux avec des agents réalistes capables de réagir aux décisions politiques. Grâce à une modélisation multi-niveaux, et le couplage de différentes dynamiques, le système apprend les spécificités de l’environnement pour proposer des politiques pertinentes. Notre seconde contribution concerne l’autonomie et l’adaptation de la couche décisionnelle avec un apprentissage par renforcement multi-agents et multi-niveaux. Un ensemble d’agents, regroupés en clusters, est distribué dans le périmètre  étudié pour apprendre des spécificités locales sans connaissance a priori de son environnement. L’attribution d’un score de confiance et de récompenses individuelles permettent d’atténuer l’impact de la non-stationnarité sur la réutilisation d’expériences nécessaire à l’apprentissage profond. Ces contributions conduisent à un système complet de co-construction de politiques urbaines dans le contexte de la Smart City. Nous comparons notre modèle avec d’autres approches de la littérature sur une politique de tarification du stationnement urbain, afin de mettre en  évidence les apports et les limites de nos contributions.


Encadrant : Salima Hassas
Co-encadrant : Véronique Deslandres

Jury :
Mr. Vinvent ChevrierProfesseur(e)Université Lorraine, INRIA, NancyRapporteur(e)
Mr. Stéphane GallandProfesseur(e)Université de Technologie de Belfort-MontbéliardRapporteur(e)
Mr. Amblard FrédéricProfesseur(e)IRT, Université de ToulouseExaminateur​(trice)
Mr. Eric DuchêneMaître de conférenceUniversité Claude Bernard-Lyon 1Examinateur​(trice)
Mme Julie Dugdale Maître de conférenceLIG, Université Grenoble AlpesExaminateur​(trice)
Mme Salima HassasProfesseur(e)Université Claude Bernard - Lyon 1Directeur(trice) de thèse
Mme Véronique DeslandresMaître de conférenceUniversité Claude Bernard Lyon 1Co-encadrant(e)
Mme Vassilissa Lehoux-LebaqueDocteurNAVER LABS EUROPECo-encadrant(e)