Thèse de Roland Kotto Kombi


Sujet :
Traitement distribué de requêtes continues sur des flux adapté aux communautés d'utilisateurs

Date de soutenance : 31/12/2018

Encadrant : Philippe Lamarre
Co-encadrant : Nicolas Lumineau

Résumé :

Avec l'émergence du Big Data, de nombreuses techniques de stockage, distribution et traitement de grands volumes de données sont apparues. Toutefois, cette évolution n'impacte pas seulement le volume des données mais également leur variété. En effet, des flux de données de plus en plus importants sont générés (e.g. données de réseaux sociaux) et des requêtes complexes sont soumises sur ces flux. Un flux peut être modélisé comme une séquence potentiellement infinie d'éléments, un élément étant une paire . Les requêtes complexes sur des flux, dites requêtes continues, peuvent être représenté comme des graphes acycliques. Chaque sommet représente un opérateur atomique et potentiellement parallélisable. Les arêtes définissent les voies de transmissions de flux entre les opérateurs. La distinction majeure entre les requêtes continues et les requêtes sur des jeux de données finis est qu'une requête continue ne se termine jamais. Ce travail de thèse s'inscrit dans le cadre du projet ANR SOCIOPLUG (INFRA2013-2017) et a pour objectif la conception d'une architecture améliorant les techniques existantes des Systèmes de Gestion de Flux de Données en se concentrant sur les aspects suivants :
-La capacité de traiter des requêtes continues sur des flux de données en incluant une gestion automatique des pannes et en respectant des contraintes de latence et de qualité des résultats.
-La capacité d'effectuer ces traitements sur un réseau de noeuds aux capacités de calcul et de mémoire limitées.
-L'intégration de mécanismes d'auto-adaptation aux variations de flux de données (élasticité) afin de consommer uniquement les ressources nécessaires tout en respectant les contraintes de performance. Cette adaptation doit prendre en compte l'état de l'environnement d'exécution et les coûts engendrés par la reconfiguration des traitements.