Thèse de Romain Deville


Sujet :
Fouille de grilles en analyse d'images et de vidéos dans un contexte de classification.

Date de soutenance : 30/09/2018

Encadrant : Christine Solnon

Résumé :

Cette thèse s'inscrit dans le contexte du projet ANR Solstice (Similarités entre données localement structurées pour la vision par ordinateurs). Le but de ce projet de recherche fondamentale est de mettre au point des nouveaux modèles et des outils pour représenter et analyser les images ou les vidéos. Les applications ciblées concernent la reconnaissance d'objets dans les images, le suivi d'objets dans les vidéos et la
reconnaissance d'activités dans les vidéos. Pour traiter ces applications, nous proposons de représenter l'information spatiale et temporelle sous la forme de grilles et d'étiqueter les sommets et arêtes de ces grilles par les attributs classiquement utilisés en vision pour décrire les informations locales telles que la géométrie, la texture, la couleur ou encore les motsvisuels. Il s'agit ensuite de développer de nouveaux algorithmes pour extraire de la connaissance à partir de ces nouvelles descriptions.
Un premier objectif de cette thèse sera d'étudier la représentation d'images sous
formes de grilles de mots visuels. A partir de cette étude, nous rechercherons des motifs
fréquents au sein de ces grilles afin de définir des motifs pertinents dans un contexte de classification d'images. Cette étude pourra aboutir à la proposition de nouveau algorithme de fouille de grille.
Un second objectif sera l'utilisation des recherches précédemment effectuées afin de
les appliquer à un contexte de classification vidéo. Une attention particulière sera alors portée sur la représentation de la dimension temporelle au sein des vidéos, l'application de celle-ci pour la représentation de vidéo par des graphes, ainsi que l'impact sur la fouille de motifs fréquents.