Thèse de Julia Cohen


Sujet :
Détection d’objets industriels à l’aide de modèles 3D dans des images égocentriques

Date de soutenance : 13/07/2022

Encadrant : Laure Tougne Rodet
Co-encadrant : Carlos Crispim-Junior

Résumé :

L’assemblage de produits industriels peut aujourd’hui être facilité et accéléré par l’usage de solutions numériques innovantes telles que la réalité augmentée (RA). En effet, le développement de nouveaux supports tels que des casques de RA permet aux opérateurs de visualiser des instructions tout en ayant les mains libres pour la manipulation des pièces. La détection de ces objets industriels par une caméra positionnée sur le casque permet une adaptation des éléments virtuels à la scène réelle. Cependant, les images issues d’un casque de RA présentent des difficultés inhérentes à leur point de vue égocentrique. Bien que la détection d’objets dans des images soit l’une des applications dans lesquelles l’apprentissage profond excelle, les réseaux de neurones artificiels sont rarement appliqués aux images égocentriques et contenant des objets industriels. En particulier, la tâche se complique lorsqu’aucune image réelle des objets à identifier n’est disponible, et lorsque l’algorithme de détection doit être déployé sur un système embarqué pour une application en temps réel.

Dans cette thèse, nous nous attaquons à cette problématique en tirant parti de la disponibilité des modèles 3D des objets d’intérêts, afin de générer un jeu de données synthétique égocentrique pour l’entraînement de réseaux de neurones compacts, dédiés à la détection mobile et en temps réel.  Nous analysons les éléments de ce jeu de données permettant de se passer totalement d’images réelles. Par la suite, nous proposons d’utiliser l’information de profondeur contenue dans une image RGB-D afin d’améliorer la performance du détecteur d’objets. Nous abordons ainsi la problématique de la généralisation de domaine entre des images RGB-D synthétiques et réelles, et nous proposons différentes approches afin de réduire l’écart à la réalité, compatibles avec une inférence mobile et en temps réel.


Jury :
M. Desbarats PascalProfesseur(e)Université de BordeauxRapporteur(e)
M. Mille JulienMaître de conférenceINSA Centre - Val de LoireRapporteur(e)
Mme Tougne Rodet LaureProfesseur(e)Université Lyon 2Directeur(trice) de thèse
M. Aubry MathieuMaître de conférenceEcole des Ponts ParisTechExaminateur​(trice)
Mme Fromont ElisaProfesseur(e)Université de Rennes 1Examinateur​(trice)
M. Crispim-Junior CarlosMaître de conférenceUniversité Lyon 2Co-encadrant(e)
M. Chiappa Jean-MarcGroupe DEMSInvité(e)