GRAPHEM : Projet ANR
Le projet GRAPHEM est un projet pluridisciplinaire visant à l’analyse informatisée des écritures médiévales. Le programme a une durée de trois ans et est censé se conclure pour le 30 juin 2011. Il a pour double ambition :
- de faire progresser la compréhension de l’évolution des formes de l’écriture,
- de créer des méthodes efficaces d’accès au contenu des manuscrits reposant sur la similarité de l’image des mots (Word-Spotting, Word-Retrivial).
La variété des écritures médiévales utilisant l’alphabet latin doit permettre d’élaborer et de tester des descripteurs de formes qui seront employés dans les deux cas. Une attention particulière sera portée à l’étude du graphème entendu comme l’élément minimal du tracé porteur d’une information pertinente.
Les laboratoires constituant le consortium sont le LIRIS, l’IRHT, le LIFO, le CRIP5 et l’Ecole nationale des chartes. Ils ont déjà travaillé ensemble, il y a quelques années, dans un projet d’exploration des manuscrits médiévaux, projet appartenant au programme “Société de l’information” du CNRS et intitulé “Formes et couleurs, outils de recherche”. C’est dans ce contexte que la problématique de GRAPHEM a été conçue.
Les résultats escomptés sont de nature différente.
Pour la paléographie, il s’agit d’améliorer la typologie en mettant en jeu de nouveaux critères de discrimination des classes d’écriture.
Les méthodes d’accès au contenu textuel constituent une alternative aux méthodes de reconnaissance optique des caractères (O.C.R.), impuissantes sur les écritures anciennes. Elles ont vocation à être utilisées dans d’autres contextes que le manuscrit du Moyen Âge.

