Thèse de Assitan Traore


Sujet :
Catégorisation des comportements de conduite en termes de consommation de carburant.

Date de soutenance : 19/01/2017

Encadrant : Alain Mille

Résumé :

Cette thèse se situe dans un domaine de recherches de l’IFSTTAR (Institut Français des Sciences et Technologie des Transports, de l’Aménagement et des Réseaux) dont l’objectif est de promouvoir l’éco-conduite en modifiant les comportements de conduite pour réduire les consommations de carburant. Il s’agit pour cela de définir les principes d’une conduite économe en fonction du contexte de conduite et d’assister le conducteur afin qu’il adopte ces principes de conduite. Plus précisément, l'objectif de cette thèse est de produire des connaissances sur les comportements de conduite permettant d’expliquer la sur ou sous consommation de carburant. La modélisation des comportements de conduite s’appuiera sur les données recueillies en situation naturelle (c'est-à-dire recueillies sur le véhicule personnel du sujet lors de ses différents déplacements journaliers et ceci pendant plusieurs mois).
Ce type de données écologiques est extrêmement riche pour connaitre les usages réels en termes de conduite, mais leur analyse est rendue compliquée par leur nature hétérogène. Il est donc intéressant de les étudier en s’appuyant sur de nouvelles approches de découverte de connaissances permettant l’introduction des connaissances des experts du domaine (connaissances du laboratoire en sciences cognitives pour aborder la recherche du point de vue de l'activité de conduite , les motivations du conducteur et les experts en motorisation pour la consommation) dans ce processus d’analyse pour expliquer un critère de performance donné (pour nous la sur/sous consommation).
Dans les recherches actuelles, les connaissances des experts en activité de conduite sont souvent prises en amont pour définir les observables mais pas dans l’ensemble du processus d’analyse. Ceci est souvent dû au fait que les statisticiens raisonnent sur des indicateurs globaux (nombre de freinage etc) et les ergonomes sur des situations locales (objectif de conduite dans une infrastructure donnée). De plus, ces recherches sont souvent confrontées aux problèmes du nombre trop important d’indicateurs de performance qui ne permettent pas de converger par des algorithmes de fouille de données. En effet, soit les indicateurs ne sont pas pertinents et ils induisent du « bruit » dans les analyses, soit ils sont trop spécifiques et ne sont pas représentatifs.
L’approche proposée est donc de définir une méthodologie d’analyse permettant de combiner plusieurs méthodes de fouille de données en introduisant les connaissances des experts du domaine dans les quatre étapes suivantes :
Caractérisation des situations de conduite. Pour cela, on s’appuiera sur des recherches sur la modélisation cognitive (Bellet Tattegrain) et les réseaux bayésiens (par exemple, les chaines de Markov Dapzol 2001) en les généralisant sur l’ensemble des situations. Cela permettra d’avoir des groupes de situations homogènes (même contexte routiers et même objectif de conduite).
Acquisition des connaissances : cette étape permettra d’acquérir les connaissances des experts pour identifier et définir des paramètres pertinents qui expliquent certains comportements dans des situations bien précises.
Préparation des données. Pour définir un ensemble d’indicateurs potentiellement utiles pour discriminer les situations d’un groupe entre elles, il faut alors transférer les facteurs des experts dans des indicateurs observables sur les données recueillies. Pour cela, on s’appuiera sur des connaissances des experts en SPI et sur les résultats des recherches sur l’activité de conduite (par exemple, Ericsson 2005, Mathern 2012).
Identification des paramètres pertinents. Cette étape centrale de fouille de données doit résoudre les problèmes de sélection parmi l’ensemble des indicateurs précédents ceux qui expliquent réellement le critère de performance. Pour cela, des méthodes d’extraction des connaissances à partir des données (data mining) seront utilisées et les résultats seront validés par les experts en conduite automobile.
Extraction des règles de production de connaissance : cette étape finale résumera les différentes analyses par un ensemble de règles expliquant la consommation en carburant qui est notre critère de performance.
L’avantage de cette approche est d’utiliser les connaissances des experts et le contexte de l’activité pour faire une représentation précise et concrète d'un évènement ou d’une situation de l'activité. Cette représentation de l’activité sous forme de règle peut être utilisée pour expliquer, prédire ou créer un système d’aide à la conduite qui réduit la consommation en carburant.