Thèse de Anthony Berthelier


Sujet :
Etudes techniques de compression de réseaux de neurones pour sa mise en place dans une architecture embarquée de type Smartphone

Date de soutenance : 09/12/2021

Encadrant : Stefan Duffner
Co-encadrant : Christophe Garcia

Résumé :

Au cours de ces dernières années, les réseaux de neurones profonds se sont montrés être des éléments centraux dans le développement de solutions intelligentes. Ils ont atteint des performances remarquables au détriment de la grande taille de leurs modèles avec de nombreuses couches profondes et des millions de paramètres. Ainsi, utiliser ces modèles pour des applications en réalité augmentée devant fonctionner sur des plateformes possédant des ressources limitées comme des systèmes embarqués ou des smartphones est une tâche loin d'être évidente. Dans ce contexte, cette thèse s'intéresse au problème de la compression et de l'optimisation de réseaux de neurones dans le but de réduire la taille de leur modèle sur des systèmes ayant des ressources limitées.Nous présentons dans une première partie différentes méthodes de compression de la littérature ainsi que leurs forces, leurs faiblesses et une brève comparaison entre elles. Nous nous intéressons également aux méthodes permettant d'optimiser la construction des architectures de réseaux de neurones profonds, allant de simples modules à la construction autonome de modèles.Nous montrons dans une deuxième partie la faisabilité technique d'une application en réalité augmentée et en temps réel utilisant un modèle d'apprentissage profond pour de l'analyse de visages. En utilisant des frameworks adaptés et une architecture optimisée, nous arrivons à segmenter différents composants du visage de manière robuste en temps réel sur un iPhone X.Les deux dernières parties sont consacrées au développement et à l'évaluation d'une nouvelle méthode de compression de réseaux de neurones convolutifs profonds. Basée sur un terme de régularisation défini sur les coefficients des filtres du modèle, notre approche permet d'introduire de la dispersion au sein des poids du réseau. Cela a pour effet de redistribuer l'information entre les filtres du modèle, nous permettant de supprimer les filtres ayant une valeur faible suite à cette opération. Nous évaluons les performances de notre méthode sur des tâches de classification classiques. Nous introduisons aussi l'efficacité de notre technique sur des modèles et des tâches de classification, segmentation et détection plus complexes en spécialisant les modèles sur certaines sous-catégories de jeux de données.


Jury :
M. Duffner StefanMaître de conférenceLIRIS INSA LyonCo-directeur (trice)
M. Blanc ChristopheUniversité Clermont-Ferrand 2Examinateur​(trice)
M. Garcia ChristopheProfesseur(e)LIRIS INSA LyonCo-encadrant(e)
Mme Tougne LaureProfesseur(e)LIRIS Université Lumière Lyon 2Examinateur​(trice)
Mme Caplier AliceProfesseur(e)Université Grenoble AlpesRapporteur(e)
M. Lefebvre GrégoireProfesseur(e)INSA LyonExaminateur​(trice)
M. Conte DonatelloProfesseur(e)Université de ToursExaminateur​(trice)