Thèse de Firas Zouari
Sujet :
Date de soutenance : 27/06/2023
Encadrant : Chirine Ghedira Guegan
Résumé :
Nous assistons aujourd'hui à une augmentation de plus en plus importante de nombre d'échanges et de flux migratoires. Ces échanges et les catastrophes naturelles sont considérés parmi les facteurs les plus influents sur la propagation et l’émergence de maladies infectieuses. Ce fait est affirmé par la récente pandémie de COVID-19, qui a provoqué une crise sanitaire critique à l'échelle mondiale. Dans ce contexte, les multiples sources de données, notamment les données ouvertes, issues de réseaux sociaux, des données des patients et d’IoT jouent un rôle crucial pour la génération desdites données liées à la santé et leur analyse. Ces données sont caractérisées par un aspect très dynamique, hétérogène, complexe, ayant un facteur de croissance élevé. Ces caractéristiques peuvent avoir un impact sur leurs utilités et handicaper le processus d'analyse, particulièrement dans les systèmes de gestion des crises sanitaires qui font l'objet de la présente thèse. Malgré les importants progrès technologiques, les systèmes actuels de gestion de crises sanitaires ne sont pas encore capables de traiter cette masse de données en toute autonomie et intelligence véritable, comme ils doivent toujours faire recours à des situations prévisibles et préprogrammées pour générer des recommandations. Par ailleurs, les utilisateurs utilisent souvent ces systèmes de gestion de crises dans différentes situations chaotiques qui impliquent plusieurs contraintes, entre autres le temps restreint pour prendre des décisions efficaces. Par conséquent, les préférences et les exigences des utilisateurs envers la qualité des données et les recommandations souhaitées peuvent être très variables en fonction des rôles des utilisateurs et du contexte de décision. Ainsi, le défi de la présente thèse est de répondre au problème suivant : "Comment générer des recommandations de manière intelligente et autonome sur des données multi-sources, hétérogènes, incertaines et complexes, regroupées dans un lac de données sans avoir connaissance préalable ?".
De ce fait, nous avons identifié deux sous-problèmes concernant les systèmes de recommandation prenant compte des besoins d'une multitude des utilisateurs dans différents contextes. Plus précisément, nous nous sommes concentrés sur les sous-problèmes sous-jacents, à savoir (1) "Comment assurer la gestion de données hétérogènes, et plus spécifiquement, la curation de données collectées en batch et en streaming d'une manière adaptative en considérant les besoins fonctionnels et non fonctionnels de l'utilisateur ?" et (2) "Comment recommander des mesures de santé préventives tout en proposant des explications adaptées aux rôles des utilisateurs dans différents contextes de décision ?". Ainsi, notre objectif principal est de proposer une approche intégrant un système intelligent pour recommander les mesures de santé préventives appropriées en fonction des besoins de l'utilisateur via l'analyse de données provenant de sources multiples. Pour ce faire, nous avons proposé des contributions abordant chaque étape impliquée dans la recommandation des mesures sanitaires. Premièrement, nous avons proposé une approche de composition de services de curation des données adaptative dans les data lakehouses en tenant compte du rôle de l'utilisateur, de ses préférences, des contraintes et du contexte de décision. En effet, nous nous sommes appuyés sur les data lakehouses comme une solution pratique pour surmonter les défis de l'intégration des données massives. Nous avons donc tiré profit des technologies sémantiques et d'apprentissage par renforcement pour constituer un framework multicouche pour ladite curation des données. Deuxièmement, nous nous sommes concentrés sur les problèmes de prédiction de maladies et de recommandation de mesures de santé en proposant une approche basée sur les technologies sémantiques pour la recommandation de mesures de santé explicables adaptées à de multiples utilisateurs ayant des besoins différents. Les contributions présentées sont mises en œuvre et expérimentées sur des scénarios du domaine médical.
Jury :
Mme. MATTA Nada | Professeur(e) | Université de Technologies de Troyes | Rapporteur(e) |
M. ZARGAYOUNA Mahdi | Chargé(e) de Recherche | Université Gustave Eiffel | Rapporteur(e) |
M. BENKHALIFA Elhadj | Professeur(e) | Staffordshire University, UK | Examinateur(trice) |
M. CHBEIR Richard | Professeur(e) | Université de Pau et des Pays de l'Adour | Examinateur(trice) |
M. KARRAY Hedi | Professeur(e) | Ecole Nationale d'Ingénieurs de Tarbes | Examinateur(trice) |
Mme. KABACHI Nadia | Maître de conférence | Université Claude Bernard Lyon 1 | Co-directeur (trice) |
Mme. GHEDIRA GUEGAN Chirine | Professeur(e) | Université Jean Moulin Lyon 3 | Directeur(trice) de thèse |
M. DUSSART Claude | Professeur(e) | Parcours santé systémique | Invité(e) |
Mme. BOUKADI Khouloud | Professeur(e) | Université de Sfax, TN | Invité(e) |