Thèse de Rim Walha


Sujet :
Magnification des textes dans les images de documents numérisés et les vidéos.

Résumé :

La résolution des images, c'est à dire la densité de pixels dans une surface donnée, est une caractéristique importante qui influence la représentation des détails. Si la résolution a un impact mineur pour les images naturelles, elle est absolument importante pour les images de documents pour lesquelles la perte de détails peut rendre un texte illisible par l'Homme et impossible à reconnaitre par les systèmes de reconnaissance optique de caractères (OCR, Optical Character Recognition). Le besoin des images de haute résolution continue à progresser dans diverses applications de vision par ordinateur afin d'obtenir de meilleures performances au niveau de la reconnaissance des formes et l’analyse des images. Cependant, les images de haute résolution ne sont pas toujours disponibles à cause, par exemple, de l'ancienneté des scanners utilisés dans les anciens projets de numérisation.

Les travaux de recherche de cette thèse s’intègrent dans le contexte de la magnification des textes dans les images et les vidéos de basse résolution. L’objectif principal de cette thèse consiste à reconstruire une image de haute résolution à partir d'une ou plusieurs images observées de basse résolution. Les méthodes génériques et non supervisées ne peuvent pas reconstruire des formes aussi complexes engendrées par les caractères dans un document textuel numérisé. Nous avons donc choisi de nous orienter vers les méthodes supervisées basées sur l'apprentissage sur un nombre significatif d'images de caractères. Parmi les méthodes supervisées existantes, nous avons choisi l'analyse parcimonieuse qui offre un cadre méthodologique rigoureux en mathématiques pour de nombreuses applications en traitement et restauration des images. Cette approche est adaptée aux spécificités particulières qui distinguent les images textuelles des images naturelles. En perspectives, nous étendrons l'analyse parcimonieuse à d'autres applications voisines à la magnification comme la reconstruction des formes de caractères dégradés, la réduction du flou, la segmentation des caractères dans les images bruitées...


Encadrant : Christophe Garcia
Co-encadrant : Frank Lebourgeois

Date de soutenance : vendredi, 8 avril, 2016