Thèse de Joffrey Decourselle


Sujet :
Enrichissement Sémantique d’Entités Culturelles

Date de soutenance : 06/11/2018

Encadrant : Mohand-Said Hacid

Résumé :

De nombreux efforts ont été faits ces dernières années pour faciliter la gestion et la représentation des entités culturelles. Toutefois, il existe encore un grand nombre de systèmes souvent isolés et encore utilisés dans les institutions culturelles reposant sur des modèles non sémantiques qui rendent difficile la validation et l’enrichissement des données. Cette thèse a pour but de proposer de nouvelles solutions pour améliorer la représentation et l’enrichissement sémantique de données culturelles en utilisant les principes du Web Sémantique. Pour ce faire, la recherche est focalisée d’une part sur l’adoption de modèles plus sémantiques comme selon les principes de FRBR qui permet de représenter des familles bibliographiques complexes en utilisant un modèle entités associations avec différents niveaux d’abstraction. Toutefois, la qualité d’une telle transformation est cruciale et c’est pourquoi des améliorations doivent être faites au niveau de la configuration et de l’évaluation d’un tel processus. En parallèle, la thèse cherche à profiter de ces nouveaux modèles sémantiques pour faciliter l’interconnexion des données avec des sources externes comme celles du Linked Open Data ou des sources moins structurées (Sites Web, Flux). Cela doit permettre de générer des bases de connaissances thématiques plus en accord avec les besoins des utilisateurs. Cependant, l’agrégation d’informations depuis des sources hétérogènes implique des étapes d’alignement à la fois au niveau du schéma et au niveau des entités.