Thèse de Yuyao Zhang


Sujet :
La réduction de la dimension Non-linéaire et Le modèle intégrant des Représentations Parcimonieusesles pour l’analyse faciale

Date de soutenance : 20/02/2014

Encadrant : Jean-Michel Jolion
Co-encadrant : Khalid Idrissi

Résumé :

Les techniques d'analyse du visage exigent généralement une représentation appropriée d'images au moyen de la réduction de dimension menant aux collecteurs incorporés, qui visent à capturer les caractéristiques pertinentes des signaux.
Dans cette thèse, nous fournissons d'abord une vue générale compréhensive sur l'état de l'art des modèles diversifiés incorporés.
Ensuite, nous appliquons une nouvelle Méthode de incorporée non-linéaire, Kernel Similarity Principle Component Analysis (KS-PCA), aux Modèles Actifs d'Apparence (AAMs), pour modeler des apparences du visage sous l'illumination variable. L'algorithme proposé surpasse avec succès le PCA linéaire traditionnel transforment pour capturer les caractéristiques saillantes qui produit par des illuminations différentes et reconstruit les visages illuminé avec haute exactitude.
Nous considérons aussi le problème de classifier automatiquement des poses du visage humaines des vues du visage avec l'illumination variante, aussi bien que l'occlusion et le bruit. Basé sur les méthodes des représentations parcimonieuses, nous proposons deux cadres d'Apprentissage de dictionnaire pour ce problème.
Le premier cadre est la Classification de pose basé sur Active Sparse Representation (ASRC).
Il forme le dictionnaire via un modèle linéaire qui est appelé l'Incremental Principle Component Analysis (Incremental PCA), ayant tendance à diminuer la redondance d'intra-classe qui peut affecter la performance de la classification, en gardant la redondance d'extra-classe qui est critique pour les représentations parcimonieuses.
L'autre travail proposé est le modèle des représentations parcimonieuses basé sur le Dictionary-learning Sparse Representation (DLSR), qui apprend le dictionnaire dans le but de coïncider avec le critère de la classification. Ce but de la formation est réalisé par l'algorithme K-SVD.
Dans une série d'expériences, nous montrons la performance des deux méthodes d'Apprentissage dictionnaire qui sont respectivement basées sur un linéaire transforment et un modèle des représentations parcimonieuses.
En plus, nous proposons un nouveau cadre de Dictionary learning for Illumination Normalization (DLIN). DLIN basé sur des représentations parcimonieuses en termes des dictionnaires couplés. Les paires de dictionnaires sont conjointement optimisées à partir des images du visage illuminées normalement et des images du visage illuminées irrégulièrement.
Nous utilisons alors un Gaussian Mixture Model (GMM) pour augmenter la capacité du cadre à modelage des données dans la distribution complexe. Le GMM adapte chaque modèle à une partie des échantillons et les fond ensuite ensemble. Des résultats expérimentaux démontrent l'efficacité du sous-population comme un antérieur pour la normalisation d'illumination à base des pièces d'image du visage.