Thèse de Antoine Willerval
Sujet :
Date de début : 10/09/2022
Date de fin (estimée) : 10/09/2025
Encadrant : Angela Bonifati
Résumé :
Les objectifs scientifiques concernent la réalisation d’une base de données distribuée de triplets RDF dans un endpoint RDF et réduire les délais lors des requêtes avec un endpoint plus performant dans son indexation et son exécution.
La réalisation d’un endpoint RDF capable de gérer au moins une dizaine de milliards de triplets en gardant une utilisation minimale des ressources de l’utilisateur pour pouvoir l’utiliser sur du matériel de base (quelques dizaines de gigaoctets de RAM pour 1 ou 2 téraoctets d’espace disque). Tout ceci en gardant la possibilité de se scaler horizontalement (‘scale out’ en Anglais - réalisation en parallèle des actions) suivant la demande en ressource en limitant la scalabilité verticale ('scale up' en Anglais, c’est-à-dire demander plus de ressources sur une seule machine).
Ce sujet est un sujet très important dans le domaine de bases de données graphes et permettra de réaliser un système qui utilise le principe de ‘scale out’ permettant d’exploiter plusieurs machines pour effectuer des requêtes plus efficaces.