Thèse de Yan Liu


Sujet :
Extension des « sacs-de-mots » à un grand nombre de catégories

Date de début : 01/02/2007
Date de fin (estimée) : 01/02/2010

Encadrant : Liming Chen

Résumé :

La catégorisation d’images est le problème de reconnaissance des formes qui consiste à associer un ou plusieurs labels à une image en fonction de son contenu sémantique. Des approches dites « sac-de-mots », inspirées de la catégorisation de texte, ont obtenu de meilleurs résultats. Il est possible de caractériser une image par le nombre d’occurrences de chaque mot visuel. Ce vocabulaire visuel, appris automatiquement sur un ensemble d’apprentissage, aide à combler le fossé sémantique qui existe entre les informations de bas niveau extraites des images (couleur, texture, forme, etc.) et les concepts haut niveau à reconnaître. Ces histogrammes sont ensuite utilisés en entrée de classificateurs discriminatifs (typiquement, un par catégorie).

La problématique de cette thèse sera donc d’étendre l’approche « sac-de-mots » à un grand nombre de catégories (plusieurs centaines voire plusieurs milliers). La solution que nous proposons donc d’explorer au cours de cette thèse sera basée sur des hiérarchies de vocabulaires. A la racine de cette hiérarchie, un vocabulaire très grossier permettra de reconnaître des catégories très générales alors que les feuilles contiendront des vocabulaires spécialisés permettant de reconnaître des concepts très fins.

Cette thèse CIFRE est sous la codirection du Professeur Liming Chen et de Florent Perronnin (Xerox Research Centre Europe)