Ph

Ph.D Olivier CAVADENTI

Contribution de la découverte de motifs à l'analyse de collections de traces unitaires

Download Draft here

Defended on September 27th 2016 at INSA de Lyon

Committee

Pr. Jérôme AZE, Université de Montpellier, LIRMM, Rapporteur
Pr. Jean-François BOULICAUT INSA Lyon, LIRIS, co-directeur

Pr. François BRUCKER, Ecole Centrale de Marseille

Dr. Mehdi KAYTOUE, INSA Lyon, LIRIS, co-directeur

Frédéric MENUT, Chef de Projet ACTEMIUM Saint-Etienne

Pr. Pascal PONCELET, Université de Montpellier, LIRMM
Dr. Cheddy RAISSI, INRIA Grand-Est, équipe ORPAILLEUR
Pr. Alexandre TERMIER, Université de Rennes, IRISA, rapporteur

Résumé. Dans le contexte manufacturier, un ensemble de produits sont acheminés entre différents sites avant d’être vendus à des clients finaux. Chaque site possède différentes fonctions : création, stockage, mise en vente, etc. Les données de traçabilités décrivent de manière riche (temps, position, type d’action,. . . ) les évènements de création, acheminement, décoration, etc. des produits. Cependant, de nombreuses anomalies peuvent survenir, comme le détournement de produits ou la contrefaçon d’articles par exemple. La découverte des contextes dans lesquels surviennent ces anomalies est un objectif central pour les filières industrielles concernées. Dans cette thèse, nous proposons un cadre méthodologique de valorisation des traces unitaires par l’utilisation de méthodes d’extraction de connaissances. Nous montrons comment la fouille de données appliquée à des traces transformées en des structures de données adéquates permet d’extraire des motifs intéressants caractéristiques de comportements fréquents. Nous démontrons que la connaissance a priori, celle des flux de produits prévus par les experts et structurée sous la forme d’un modèle de filière, est utile et efficace pour pouvoir classifier les traces unitaires comme déviantes ou non, et permettre d’extraire les contextes (fenêtre de temps, type de produits, sites suspects,. . . ) dans lesquels surviennent ces comportements anormaux. Nous proposons de plus une méthode originale pour détecter les acteurs de la chaîne logistique (distributeurs par exemple) qui auraient usurpé une identité (faux nom). Pour cela, nous utilisons la matrice de confusion de l’étape de classification des traces de comportement pour analyser les erreurs du classifieur. L’analyse formelle de concepts (AFC) permet ensuite de déterminer si des ensembles de traces appartiennent en réalité au même acteur.

Abstract. In a manufacturing context, a product is moved through different placements or sites before it reaches the final customer. Each of these sites have different functions, e.g., creation, storage, retailing, etc. In this scenario, traceability data describes in a rich way the events a product undergoes in the whole supply chain (from factory to consumer) by recording temporal and spatial information as well as other important elements of description. Thus, traceability is an important mechanism that allows discovering anomalies in a supply chain, like diversion of computer equipment or counterfeits of luxury items. In this thesis, we propose a methodological framework for mining unitary traces using knowledge discovery methods. We show how the process of data mining applied to unitary traces encoded in specific data structures allows extracting interesting patterns that characterize frequent behaviors. We demonstrate that domain knowledge, that is the flow of products provided by experts and compiled in the industry model, is useful and efficient for classifying unitary traces as deviant or not. Moreover, we show how data mining techniques can be used to provide a characterization for abnormal behaviours (When and how did they occur ?).We also propose an original method for detecting identity usurpations in the supply chain based on behavioral data, e.g., distributors using fake
identities or concealing them. We highlight how the knowledge discovery in databases, applied to unitary traces encoded in specific data structures (with the help of expert knowledge), allows extracting interesting patterns that characterize frequent behaviors. Finally, we detail the achievements made within this thesis with the development of a platform of traces analysis in the form of a prototype.

Publications liées à la thèse

Olivier Cavadenti, Victor Codocedo, Jean-François Boulicaut, Mehdi Kaytoue. What did I do Wrong in my MOBA Game? Mining Patterns Discreminating Deviant Behaviours. Proc. 3rd IEEE International Conference on Data Science and Advanced Analytics DSAA 2016, Special Session on Game Data Science, Montréal, Canada, October 2016. pp. 662-671.
Olivier Cavadenti, Victor Codocedo, Mehdi Kaytoue, Jean-Francois Boulicaut. Fouille de motifs intelligibles et caractéristiques d'anomalies dans des traces unitaires. Actes Extraction et Gestion de Connaissances EGC 2016, janvier 2016, Reims (F), pp. 27-38.
Olivier Cavadenti, Victor Codocedo, Jean-François Boulicaut, Mehdi Kaytoue. When Cyberathletes Conceal Their Game: Clustering Confusion Matrices to Identify Avatar Aliases. Proc. 2nd IEEE International Conference on Data Science and Advanced Analytics DSAA'2015, Paris, France, October 2015, pp. 1-10.
Olivier Cavadenti, Victor Codocedo, Mehdi Kaytoue and Jean-Francois Boulicaut. Identifying Avatar Aliases in StarCraft 2. Proceedings of the 2nd Workshop Machine Learning and Data Mining for Sport Analytics MLSA 2015 co-located with ECML PKDD 2015, Porto, Portugal, September 2015. Unpublished proceedings.