Thèse de Sarra Ouelhadj


Sujet :
Définition d’un processus durable pour l’enrichissement sémantique des Open Data territoriales

Date de début : 02/12/2020
Date de fin (estimée) : 02/12/2023

Encadrant : Pierre-Antoine Champin

Résumé :

La Métropole de Lyon publie en Open Data plusieurs des jeux de données produits par elle-même ou ses partenaires via la plateforme data.grandlyon.com. Les données publiées sont disponibles le plus souvent dans des formats relativement standards (e.g. CSV, JSON, GeoJSON, …) assurant un bon niveau d'interopérabilité syntaxique. Cependant, les aspects sémantiques sont traités de façon assez superficielle. La signification des données est souvent transmise “hors bande”, via de la documentation textuelle dans les métadonnées, ou bien via des communications privées entre les consommateurs de données et le support utilisateurs de la plateforme. De plus, les consommateurs s’appuient parfois sur leurs propres interprétations, qui peuvent être erronées. De ce fait, une bonne partie de la valeur des Open Data publiées est difficile à exploiter.

La notion de “Linked Data” couvre un ensemble de technologies et standards recommandés par le W3C, visant à résoudre les problèmes évoqués. Elle s’appuie sur un modèle de données de type graphe orienté et labellisé (RDF) qui facilite l’intégration de données, ainsi que l’utilisation de vocabulaires partagés munis d’une sémantique explicite. 

La Métropole de Lyon compte rendre ses Open Data progressivement conformes aux principes des Linked Data, ainsi le travail de la thèse portera sur la définition d’un processus de migration robuste vis-à-vis les changements dans les données d’origine, et de permettre aux équipes de la Métropole de Lyon d’identifier les évolutions à apporter au processus et la meilleure façon de les implémenter.