Thèse de Mohammad Alshaer


Sujet :
Un canevas efficace pour le traitement et l'analyse des textes non structurés afin de découvrir les retards de livraison et d'optimiser la planification de routes en temps réel

Date de soutenance : 13/03/2019

Encadrant : Mohand-Said Hacid
Co-encadrant : Yehia Taher

Résumé :
Dans cette thèse, nous avons développé et expérimenté deux méthodes pour le traitement des données: SANA et IBRIDIA. SANA est basée sur un classificateur multinomial Naïve Bayes, tandis qu'IBRIDIA s'appuie sur l'algorithme de classification hiérarchique (CLH) de Johnson, qui est une technologie hybride permettant la collecte et le traitement de données par lots et en temps réel. SANA est une solution de service qui traite les données non structurées.  Cette méthode sert de système polyvalent pour extraire les événements pertinents, y compris le contexte (tel que le lieu, l'emplacement, l'heure, etc.). En outre, il peut être utilisé pour effectuer une analyse de texte sur les événements ciblés. IBRIDIA a été conçu pour traiter des données inconnues provenant de sources externes et les regrouper en temps  réel afin d'acquérir une connaissance / compréhension des données permettant d'extraire des événements pouvant entraîner un retard de livraison. Selon nos expériences, ces deux approches montrent une capacité unique à traiter des données logistiques. Cependant, SANA semble plus prometteur puisque la technologie sous-jacente (classificateur Naïve Bayes) a surpassé IBRIDIA du point de vue performance. Il est clairement indiqué que SANA était censé générer une connaissance graphique des événements collectés immédiatement en temps réel sans avoir à attendre, permettant ainsi de tirer le meilleur parti de ces événements. IBRIDIA est importante dans le domaine de la logistique pour identifier la catégorie d'événements la plus influente qui affecte la livraison. Malheureusement, pour IBRIRDIA, nous devrions attendre qu’un nombre minimum d’événements se présente et nous avons toujours un démarrage à froid. Étant donné que nous sommes intéressés par la ré-optimisation de l'itinéraire en temps  réel, nous avons adopté SANA comme cadre de traitement de données. Nous avons implémenté une application d'optimisation d'itinéraire afin de démontrer comment notre solution est utilisée pour extraire des informations d'événements susceptibles d'entraîner un retard de livraison et comment les itinéraires peuvent être optimisés pour éviter ce retard.
 

Jury :
Mme Grigori DanielaProfesseur(e)Université Paris-DauphineRapporteur(e)
Mr Mephu Nguifo EngelbertProfesseur(e)Universite Blaise Pascal Examinateur​(trice)
M. BENABDESLEM Khalid, McF-HDR, l'Université Lyon 1 - Examinateur
Mme Naja HalaProfesseur(e)Université LibanaiseExaminateur​(trice)
Mr Hacid Mohand-SaïdProfesseur(e)LIRIS Université Claude Bernard Lyon 1 Co-directeur (trice)
Mr Dbouk MohamedProfesseur(e)Université LibanaiseCo-directeur (trice)
Mr Taher YehiaMaître de conférenceUniversité de VersaillesCo-encadrant(e)
Mr Haque Akm RafiqulDirecteur(trice) de rechercheCognitus Invité(e)