Thèse de Yong Peng


Sujet :
AGILE, SECURE AND CONTECT-AWARE ARCHITECTURE FOR SERVICE

Date de soutenance : 15/02/2012

Encadrant : Frederique Biennier
Co-encadrant : Youakim Badr

Résumé :

La thèse concerne la mise en place de méthodes originales et complètes de valorisation des collections manuscrites du patrimoine. Ces méthodes qui porteront sur le corpus des correspondances clandestines dans l’Europe du 18ème siècle vont conduire au développement de solutions - aujourd’hui inexistantes ou partielles car circonscrites à des collections restreintes de petites tailles - d’aide à la navigation dans une collection manuscrite, d'indexation (des textes et des formes individuelles - graphies) et d’assistance à la lecture par une contribution à la reconnaissance des écritures. Plus généralement cette thèse vise à mettre en place des solutions pour la caractérisation des contenus et leur reconnaissance dans un contexte de corpus multi scripteurs (plus de 120000 documents et plusieurs dizaines de mains différentes). Ce projet pluridisciplinaire possède une composante fondamentale en Histoire de la Pensée classique, il s’intéresse au rôle de la communication manuscrite – lettres et manuscrits savants et philosophiques – dans le développement de la République des Lettres et dans la formation de l’esprit philosophique entre 1685 et 1789. Les corpus électroniques sur lesquels se fonderont les travaux de thèse permettront des recherches originales et fécondes sur le plan de l’analyse historique et philosophique, sur le plan de l’instrumentation électronique et sur le plan du traitement des images des manuscrits. Ce projet se veut généraliste dans le sens où les objets sur lesquels porte l’étude ne peuvent pas être modélisés par des representations standards du fait de la présence de contenus fortement hétérogènes et composites. Il nécessite donc la mise au point de méthodes flexibles et adaptatives (qui s’adaptent aux particularités de contenus notamment à la grande variabilité des écritures), robustes (peu sensibles au bruit et aux variations de qualité des images) privilégiant une démarche d’analyse et de reconnaissance mixte des écritures (par concurrence d’une modélisation globale des contenus écrits et d’une modélisation par allographes et dictionnaire de formes).