Thèse de Vivien Kraus
Sujet :
Date de soutenance : 12/03/2021
Encadrant : Khalid Benabdeslem
Résumé :
Avec l’avènement et le développement rapide des technologies numériques, les données sont devenues à la fois un bien précieux et très abondant. Cependant, avec une telle profusion, se posent des questions relatives à la qualité et l’étiquetage de ces données. En effet, à cause de l’augmentation des volumes de données disponibles, alors que le coût de l’étiquetage par des experts humains reste très important, il est de plus en plus nécessaire de pouvoir renforcer l’apprentissage semi-supervisé grâce l’exploitation des données non labellisées. Ce problème est d’autant plus marqué dans le cas de l’apprentissage multi-labels, et en particulier pour la régression, où chaque unité statistique est guidée par plusieurs cibles différentes,
qui prennent la forme de scores numériques. C’est dans ce cadre fondamental, que s’inscrit cette thèse. Tout d’abord, nous commençons par proposer une méthode d’apprentissage pour la régression semi-supervisée, que nous mettons à l’épreuve à travers une étude expérimentale détaillée. Grâce à cette nouvelle méthode, nous présentons une deuxième contribution, plus adaptée au contexte multi-labels. Nous montrons également son efficacité par une étude comparative, sur des jeux de données issues de la littérature. Par ailleurs, la dimensionnalité du problème demeure toujours la difficulté de l’apprentissage automatique, et sa réduction suscite l’intérêt de plusieurs chercheurs dans la communauté. Une des tâches majeures
répondant à cette problématique est la sélection de variables, que nous proposons d’étudier ici dans un cadre complexe : semi-supervisé, multi-labels et pour la régression. Enfin, une validation expérimentale est fournie sur un problème réel, concernant l’annotation automatique de pneumatiques, pour répondre aux besoins exprimés par le partenaire
industriel de cette thèse.
Jury :
Mme Clausel Marianne | Professeur(e) | Université de Lorraine | Rapporteur(e) |
Mr Mephu-Nguifo Engelbert | Professeur(e) | Université Clermont-Auvergne | Rapporteur(e) |
Mr Kheddouci Hamamache | Professeur(e) | Université Lyon 1 | Examinateur(trice) |
Mme Kuntz Pascale | Professeur(e) | Université de Nantes | Examinateur(trice) |
Mme Zehraoui Farida | Maître de conférence | Université d’Evry | Examinateur(trice) |
Mr Benabdeslem Khalid | Maître de conférence | Université Lyon 1 | Directeur(trice) de thèse |
Mr Canitia Bruno | Responsable R&D, Lizeo IT | Invité(e) |