Thèse de Mohammad Alshaer
Sujet :
Un canevas efficace pour le traitement et l'analyse des textes non structurés afin de découvrir les retards de livraison et d'optimiser la planification de routes en temps réel
Date de soutenance : 13/03/2019
Encadrant : Mohand-Said Hacid
Co-encadrant : Yehia Taher
Résumé :
Dans cette thèse, nous avons développé et expérimenté deux méthodes pour le traitement des données: SANA et IBRIDIA. SANA est basée sur un classificateur multinomial Naïve Bayes, tandis qu'IBRIDIA s'appuie sur l'algorithme de classification hiérarchique (CLH) de Johnson, qui est une technologie hybride permettant la collecte et le traitement de données par lots et en temps réel. SANA est une solution de service qui traite les données non structurées. Cette méthode sert de système polyvalent pour extraire les événements pertinents, y compris le contexte (tel que le lieu, l'emplacement, l'heure, etc.). En outre, il peut être utilisé pour effectuer une analyse de texte sur les événements ciblés. IBRIDIA a été conçu pour traiter des données inconnues provenant de sources externes et les regrouper en temps réel afin d'acquérir une connaissance / compréhension des données permettant d'extraire des événements pouvant entraîner un retard de livraison. Selon nos expériences, ces deux approches montrent une capacité unique à traiter des données logistiques. Cependant, SANA semble plus prometteur puisque la technologie sous-jacente (classificateur Naïve Bayes) a surpassé IBRIDIA du point de vue performance. Il est clairement indiqué que SANA était censé générer une connaissance graphique des événements collectés immédiatement en temps réel sans avoir à attendre, permettant ainsi de tirer le meilleur parti de ces événements. IBRIDIA est importante dans le domaine de la logistique pour identifier la catégorie d'événements la plus influente qui affecte la livraison. Malheureusement, pour IBRIRDIA, nous devrions attendre qu’un nombre minimum d’événements se présente et nous avons toujours un démarrage à froid. Étant donné que nous sommes intéressés par la ré-optimisation de l'itinéraire en temps réel, nous avons adopté SANA comme cadre de traitement de données. Nous avons implémenté une application d'optimisation d'itinéraire afin de démontrer comment notre solution est utilisée pour extraire des informations d'événements susceptibles d'entraîner un retard de livraison et comment les itinéraires peuvent être optimisés pour éviter ce retard.
Jury :
Mme Grigori Daniela | Professeur(e) | Université Paris-Dauphine | Rapporteur(e) |
Mr Mephu Nguifo Engelbert | Professeur(e) | Universite Blaise Pascal | Examinateur(trice) |
M. BENABDESLEM Khalid, McF-HDR, l'Université Lyon 1 - Examinateur | |||
Mme Naja Hala | Professeur(e) | Université Libanaise | Examinateur(trice) |
Mr Hacid Mohand-Saïd | Professeur(e) | LIRIS Université Claude Bernard Lyon 1 | Co-directeur (trice) |
Mr Dbouk Mohamed | Professeur(e) | Université Libanaise | Co-directeur (trice) |
Mr Taher Yehia | Maître de conférence | Université de Versailles | Co-encadrant(e) |
Mr Haque Akm Rafiqul | Directeur(trice) de recherche | Cognitus | Invité(e) |