Thèse de Mohamed Daoud


Sujet :
Approches d’identification automatique des micro-services et de migration de données dans un contexte de fusion de systèmes d’information hétérogènes

Résumé :

Cette thèse se situe dans le domaine des systèmes d’information et leur urbanisation. Elle vise à apporter des solutions scientifiques et opérationnelles à la problématique d’évolution de systèmes d’information dans un contexte de fusion d’entreprises. La problématique étudiée inclura la migration d’applications monolithiques existantes bâties sur des ERP propriétaires et hétérogènes vers des applications bâties sur le concept de micro services pour mieux supporter les futures évolutions et en faciliter la maintenance. Il sera alors question de proposer une méthode d’identification automatique des micro-services à partir d’applications existantes conçues de façon autonome et donc présentant des hétérogénéités structurelles et sémantiques. L’approche préconisée est basée sur la définition d’une ontologie commune à différentes entreprises exerçant des activités similaires, de proposer un langage de spécification de la sémantique des applications en utilisant les concepts de cette ontologie, et d’identifier ensuite automatiquement les micro-services par différentes techniques de clusterisation (classique k-mean, flou c-mean, hiérarchique HAC, etc.) des spécifications similaires. Cette identification des micro-services doit aussi être accompagnée d’une méthode de génération automatique des schémas de bases de données des micro-services.
Cette thèse traitera ensuite de la problématique de la migration et de l’intégration des données des différents systèmes existants vers les différentes bases de données associées aux micro-services identifiés. En effet, les micro-services disposeront de leurs propres bases de données. Cette opération de migration inclura aussi une approche d’intégration puisque les différents systèmes existants possèdent des données communes. Cette intégration des données doit bien entendu résoudre (a) les problèmes d’hétérogénéités structurelle et sémantique des données, (b) la prise en compte des différences de règles métiers des systèmes existants avec le nouveau système, et (c) la prise en compte du contexte de chaque système existant (dans lequel des informations implicites donc non représentées sont utilisées). En effet, cette notion du contexte est très importante et doit pouvoir aider à expliciter les informations implicites des systèmes d’information existants. Cette thèse bien entendu proposera une implémentation des approches proposées et des expérimentations sur tout ou une partie des applications et bases de données existantes.


Encadrant : Djamal Benslimane
Co-encadrant : Noura Faci