Thèse de Manel Charfi


Sujet :
Approche déclarative pour le stockage à long terme de données capteurs

Date de soutenance : 21/09/2017

Encadrant : Jean-Marc Petit
Co-encadrant : Yann Gripay

Résumé :

De nos jours, on a de plus en plus de capteurs qui ont tendance à apporter confort et facilité dans notre vie quotidienne. Ces capteurs sont faciles à déployer et à intégrer dans une variété d’applications (monitoring de bâtiments intelligents, aide à la personne…). Ces milliers (voire millions)de capteurs sont de plus en plus envahissants et génèrent sans arrêt des masses énormes de données qu’on doit stocker et gérer pour le bon fonctionnement des applications qui en dépendent. Chaque fois qu’un capteur génère une donnée, deux dimensions sont d’un intérêt particulier : la dimension temporelle et la dimension spatiale. Ces deux dimensions permettent d’identifier l’instant de réception et la source émettrice de chaque donnée. Chaque dimension peut se voir associée à une hiérarchie de granularités qui peut varier selon le contexte d’application.
Dans notre travail, on se focalise sur les capteurs dans le cadre des bâtiments intelligents et les applications qui requièrent le stockage à long terme des flux de données issues de ces capteurs. Ayant un ensemble de capteurs émettant des flux de données, notre problématique est la suivante : comment construire une base de données « capteurs » pour des applications qui requièrent du stockage à long terme, i.e. qui nécessitent de spécifier les données à garder dans le temps au regard des données qui peuvent être oubliées ?
Notre objectif est de mettre en oeuvre une approche déclarative qui vise à contrôler le stockage des données capteurs en ne gardant que les données jugées pertinentes selon la spécification des granularités spatio-temporelles représentatives des besoins applicatifs. Nous empruntons les concepts développés dans les années soixante-dix pour la conception de bases de données en les étendant aux spécifiés des flux de données des capteurs. les contraintes temporelles augmentées avec la dimension spatiale sont nécessaires dans notre contexte pour saisir les contraintes sous-jacentes. Nous nous basons sur l’intuition que les granularités spatiotemporelles combinées aux dépendances fonctionnelles classiques peuvent jouer un rôle majeur pour exprimer quelles sont les données pertinentes à conserver pour une utilisation à long terme.
Ensuite, nous proposons une annotation d'attributs avec des fonctions d'agrégation permettant de spécifier quelles sont les valeurs qui seront retenues selon les besoins applicatifs.
On a alors implémenté un prototype qui gère ces deux niveaux de prise en compte des flux de données des capteurs. Ce qui nous a permis de mener des expériences avec des flux de données, synthétiques et réelles, provenant de bâtiments intelligents.