Thèse de Vivien Kraus


Sujet :
Apprentissage multi-label pour l’annotation automatique de grandes masses de données sur les pneumatiques

Date de soutenance : 12/03/2021

Encadrant : Khalid Benabdeslem

Résumé :

Avec l’avènement et le développement rapide des technologies numériques, les données sont devenues à la fois un bien précieux et très abondant. Cependant, avec une telle profusion, se posent des questions relatives à la qualité et l’étiquetage de ces données. En effet, à cause de l’augmentation des volumes de données disponibles, alors que le coût de l’étiquetage par des experts humains reste très important, il est de plus en plus nécessaire de pouvoir renforcer l’apprentissage semi-supervisé grâce l’exploitation des données non labellisées. Ce problème est d’autant plus marqué dans le cas de l’apprentissage multi-labels, et en particulier pour la régression, où chaque unité statistique est guidée par plusieurs cibles différentes,
qui prennent la forme de scores numériques. C’est dans ce cadre fondamental, que s’inscrit cette thèse. Tout d’abord, nous commençons par proposer une méthode d’apprentissage pour la régression semi-supervisée, que nous mettons à l’épreuve à travers une étude expérimentale détaillée. Grâce à cette nouvelle méthode, nous présentons une deuxième contribution, plus adaptée au contexte multi-labels. Nous montrons également son efficacité par une étude comparative, sur des jeux de données issues de la littérature. Par ailleurs, la dimensionnalité du problème demeure toujours la difficulté de l’apprentissage automatique, et sa réduction suscite l’intérêt de plusieurs chercheurs dans la communauté. Une des tâches majeures
répondant à cette problématique est la sélection de variables, que nous proposons d’étudier ici dans un cadre complexe : semi-supervisé, multi-labels et pour la régression.  Enfin, une validation expérimentale est fournie sur un problème réel, concernant l’annotation automatique de pneumatiques, pour répondre aux besoins exprimés par le partenaire
industriel de cette thèse.


Jury :
Mme Clausel MarianneProfesseur(e)Université de LorraineRapporteur(e)
Mr Mephu-Nguifo EngelbertProfesseur(e)Université Clermont-AuvergneRapporteur(e)
Mr Kheddouci HamamacheProfesseur(e)Université Lyon 1Examinateur​(trice)
Mme Kuntz Pascale Professeur(e)Université de NantesExaminateur​(trice)
Mme Zehraoui FaridaMaître de conférenceUniversité d’EvryExaminateur​(trice)
Mr Benabdeslem Khalid Maître de conférenceUniversité Lyon 1Directeur(trice) de thèse
Mr Canitia BrunoResponsable R&D, Lizeo ITInvité(e)