Étude des Documents Imprimés - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2005

Étude des Documents Imprimés

Résumé

Cette thèse s'attache à l'étude de la structuration des documents dits à "typographie riche et récurrente''. Nous avons principalement travaillé sur des images de documents correspondant à des extraits d'inventaires-sommaires des Archives Départementales de Charente-Maritime et de Savoie. Nous avons proposé un procédé de segmentation qui permet d'inférer la structure physique de ces pages. Nous avons aussi développé une approche basée sur les modèles de Markov cachés pour la reconnaissance de la structure logique. En parallèle de ces avancées applicatives, nous avons mené deux réflexions plus fondamentales. La première a porté sur l'étude des caractéristiques utilisées pour la description des régions d'intérêt (entités physiques) des images de documents. La seconde a été consacrée à la mise au point d'une méthode de classification reposant sur un apprentissage sélectif. Parmi les nombreuses applications de cet algorithme, c'est l'opportunité d'effectuer une reconnaissance de caractères qui a motivé son développement.
Fichier non déposé

Dates et versions

hal-01454978 , version 1 (03-02-2017)

Identifiants

  • HAL Id : hal-01454978 , version 1

Citer

Jean Duong. Étude des Documents Imprimés : Approche Statistique et Contribution Méthodologique. 2005. ⟨hal-01454978⟩
153 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More