Thèse de Petra Bilane


Sujet :
Reconnaissance des mots dans les anciens documents manuscrits pour faciliter l'indexation et la recherche par le contenu

Date de soutenance : 01/01/2010

Encadrant : Hubert Emptoz

Résumé :

Les anciens documents manuscrits sont généralement stockés dans des boîtes ou des portfolios, cette méthode de stockage ne tient pas compte de la préservation de l’état de ces documents, étant donné qu’ils sont déjà très fragilisés par les éléments qu’ils ont du endurer dans leur existence (tels la moisissure, la mauvaise qualité de l’encre et du papier, les incendies etc.…). Une alternative à la conservation sur papier est la numérisation ou le stockage des documents sous forme électronique telles les images. Une image est une représentation statique du texte écrit et ne permet pas le traitement du texte en tant que tel or l’indexation des documents manuscrits nécessite une recherche selon leur contenu textuel. La recherche et le tri manuels nécessitent un temps et un effort énormes, d’où le besoin d’une méthode de reconnaissance et de recherche des mots dans les versions numérisées de ces documents