Thèse de Chao Zhu


Sujet :
Content-based analysis of image and video

Date de soutenance : 01/11/2011

Encadrant : Liming Chen
Co-encadrant : Charles-Edmond Bichot

Résumé :

Reconnaissance visuelle des objets est devenue un sujet de recherche très populaire et importante ces dernières années en raison de sa nombreuses applications comme l'image / vidéo indexation et recherche, le contrôle d'accès sécurité, la surveillance vidéo, etc. Malgré beaucoup d'efforts et les progrès qui ont été fait pendant les dernières années, il reste un problème ouvert et est encore considérée comme l'un des problèmes les plus difficiles dans la communauté de vision par ordinateur, principalement en raison de les similarités entre les classes et les variations intra-classe comme occlusion, clutter de fond, les changements de point de vue, pose, l'échelle et l'éclairage. Donc la première étape importante est de générer bonne description visuelle, ce qui devrait être à la fois discriminatoire et
calcul efficace, tout en possédant certaines propriétés de robustesse contre les variations mentionnées précédemment. Dans ce contexte, l'objectif de cette thèse est de proposer quelques contributions innovatrices à la tâche de reconnaissance d'objets, en particulier concernant plusieurs nouveaux features / descripteurs visuelles de représenter efficacement le contenu visuel d'objets pour la reconnaissance. Les features / descripteurs proposées intention de capturer les informations d'un objet sous différents aspects. Plus précisément, nous proposons multi-échelle couleur local binary pattern
(LBP) feature pour améliorer le pouvoir discriminant et la propriété
d'invariance photométriques de l'original LBP. Nous proposons la
combinaison orthogonale de local binary patterns (OC-LBP) pour la
réduction de la dimensionnalité de LBP et de l'utiliser pour la
description des images région locale. Nous introduisons le descripteur
DAISY pour la tâche de reconnaissance visuelle des objets de capturer
efficacement l'information de gradient. Nous proposons une nouvelle
image descripteur local appelé histogrammes des gradients de second
ordre (HSOG) pour capturer les informations de second ordre du
gradient qui sont rarement étudiés dans la littérature mais avéré
utile pour la reconnaissance d'objets. Les approches proposées ont été
validées par des expérimentations complètes conduites sur plusieurs
bases de données populaires.