Analyse multirésolution des images de documents manuscrits - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2009

Multiscale analysis of handwritten documents images

Analyse multirésolution des images de documents manuscrits

Résumé

Images of strokes, especially handwriting documents images, are often composed of heterogeneous contents and require specific methods of analysis to be exploited. In this thesis, we propose the development of a characterization of handwritings based on a non-adaptive geometrical wavelet transform which is the Curvelets transform. We validate this characterization in different application frameworks of document images analysis. The Curvelets were chosen for their property of good localization of anisotropic objects and their directional multi-scale analysis. We can extract from those two essential primitives which are orientation and curvature at varying levels of scales. These primitives are gathered in a matrix of occurrences to form the signature of a handwriting. The latter is used as a features' vector in an content based image retrieval application. We also propose an evaluation of local similarity between the smaller forms, whatever they are, where the only primitive used is orientation. Finally, as part of a specialization of our method to the corpus of images provided by the ANR project Graphem, we propose the definition of a similarity index, generated from trade between partners in this project, which attempts to use common properties of handwritings while trying to address their differences and their characteristics. This consideration, weighted by the user, allows an advanced exploitation of medieval handwritings.
Les images de traits, et plus spécifiquement les images d'écritures manuscrites, ont des contenus souvent hétérogènes et nécessitent des méthodes spécifiques d'analyse pour être exploitées. Dans cette thèse, nous proposons la mise au point d'une approche de caractérisation des écritures manuscrites basée sur la transformée en ondelettes géométriques non-adaptatives que sont les Curvelets. Nous validons cette caractérisation dans différents cadres applicatifs de l'analyse d'images de documents. Les Curvelets ont été choisies pour leur propriété de bonne localisation des objets anisotropes et leur analyse directionnelle multi-échelle. Elles permettent l'extraction de deux primitives essentielles des écritures que sont l'orientation et la courbure à des niveaux d'échelles variables. Ces primitives sont rassemblées dans une matrice d'occurrences pour constituer la signature d'une écriture. Cette dernière est utilisée comme vecteur de caractéristiques dans une application de recherche d'images par le contenu. Nous proposons également une évaluation de la similarité locale entre formes plus petites, quelles qu'elles soient, où seule la primitive orientation est utilisée. Enfin, dans le cadre d'une spécialisation de notre méthode au corpus d'images fournies par le projet ANR Graphem, nous proposons la définition d'un indice de similarité, produite à partir d'échanges entre les partenaires de ce projet, qui tente de tirer partie des propriétés communes des écritures tout en essayant de prendre en compte leurs différences et leurs spécificités. Cette prise en compte, pondérable par l'utilisateur, permet une exploitation avancée des écritures du Moyen-Age.
Fichier non déposé

Dates et versions

hal-01459708 , version 1 (07-02-2017)

Identifiants

  • HAL Id : hal-01459708 , version 1

Citer

Guillaume Joutel. Analyse multirésolution des images de documents manuscrits : application à l'analyse de l'écriture. 2009. ⟨hal-01459708⟩
57 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More