Découverte interactive et complète de chroniques - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2010

Découverte interactive et complète de chroniques

Résumé

This thesis deals with the engineering of knowledge dynamics and it focuses on the interactive discovery of knowledge from activity traces. The applicative context targeted by this work is the management of the dynamic aspect of knowledge in Knowledge Management Systems (KMS). Two theoretical contributions are presented in this thesis. Firstly, we propose an iterative and interactive process for the co-construction of dynamic knowledge that requires a dialogue and a cooperation of the machine and humans. Secondly, we present an algorithm for the complete discovery of temporal patterns in sequences of events. This algorithm implements the machine proactive behaviour in this process. Interaction traces are information that users leave when they interact with their environment. This information about users' activities is collected, sometimes intentionally, by the designer of the environment. Interaction traces are represented in an expressive format designed especially for the engineering of interaction traces: the format of modelled traces. Such interaction traces are managed separately in a Trace-Based System (TBS), which can store modelled traces and provides primitive functions to access them. We argue that such interaction traces are potential containers of contextual knowledge about how users behave in their activities mediated by the traced environment. For this reason, interaction traces can be used for building systems that provide contextual assistance to users. We propose an iterative and interactive process for the co-construction of knowledge from traces. In this process, the machine analyses the traces and suggests some behaviour patterns to the human involved in the process. The human validates these patterns if he finds them relevant. If it is not the case, the human elaborates new requests and the machine suggests new candidate patterns, and so on. The idea behind this process was to build a bottom-up knowledge construction approach that takes into account the dynamic and contextual aspects of knowledge. The proactive participation of the machine to this co-construction process implies/requires the development of an algorithm that can extract temporal pattern from interaction traces, that is complete, and that can provide patterns to the human in real time, so that the knowledge co-construction process takes the form of a dialogue between the human and the machine. Chronicles are patterns that can occur in interaction traces and that contain temporal constraints with numerical bounds. The frequent chronicle mining approach we present in this thesis has been designed to implement the machine's behaviour in this process. This algorithm is the first algorithm for chronicle extraction from a sequence of events that is complete. It allows real time interactivity with its users by returning the partial result set of frequent chronicles, at any time. The algorithm supports temporal and structural user constraints pushing, which allows the human to make the chronicle exploration procedure converge more quickly towards the most interesting chronicles. The algorithm can be configured in a way that makes it return the same non-complete chronicle result set as other existing algorithms in the literature. It can also be configured so as to return the complete frequent chronicle set, or to return the complete set of frequent hybrid episodes. Hybrid episodes are summarized forms of chronicles, with a simpler pattern structure that is easier to understand by humans. When compared to existing chronicle mining algorithms with the same conditions, our algorithm shows equivalent time performances. The main inconvenient of the chronicle discovery problem is that the size of the exploration space depends exponentially on the chronicle length. As a result, it is possible to discover only small chronicles in one shot, which implies the need for an iterative and incremental discovery approach. The platform Scheme Emerger has been developed for the purpose of this PhD project. It implements our complete chronicle discovery algorithm and it provides a graphical user interface for it. We use the platform Scheme Emerger to illustrate our knowledge co-construction process with interaction traces of the platform CollaborativeECM, which is the collaborative platform that has been developed within the project PROCOGEC.
Cette thèse se situe dans le cadre de l'ingénierie de la dynamique des connaissances et s'intéresse plus particulièrement à la découverte interactive de connaissances dans les traces d'interactions. La gestion de la dynamique des connaissances liée à la mise en place d'un environnement de gestion de connaissances constitue le cadre applicatif principal du travail. Les contributions théoriques concernent d'une part la proposition d'un processus de co-construction de connaissances exploitant les capacités d'apprentissage automatique de la machine et les capacités d'interprétation de l'utilisateur et d'autre part une contribution algorithmique permettant d'exploiter de manière interactive un processus de découverte dans des séquences temporelles d'événements. Les traces d'interactions sont des informations que les utilisateurs d'un système informatique laissent lors de leurs activités. Ces informations sont collectées volontairement ou non par le concepteur du système. Lors de la collecte, elles sont représentées dans un format expressif dédié à l'ingénierie des traces, le format des traces modélisées, et sont accessibles par l'intermédiaire d'un système de gestion des traces (SBT) qui gère leur stockage. Nous argumentons que ces traces d'interactions sont des conteneurs de connaissances riches en informations contextuelles et qu'il est possible de les utiliser pour inférer des connaissances pertinentes sur l'activité tracée et exploitables par des systèmes d'assistance à l'utilisateur. Nous proposons un processus de co-construction de connaissances à partir de traces, qui est itératif et interactif. L'humain et la machine jouent tour à tour un rôle dans la construction des connaissances : la machine propose des motifs de comportement de l'utilisateur à partir des traces et l'humain valide ces motifs s'il les reconnaît et les juge intéressants. Dans le cas contraire, il formule de nouvelles requêtes à la machine qui lui propose alors de nouveaux motifs, et ainsi de suite. L'idée est d'implémenter un processus de construction de connaissances ascendant qui prenne en compte les aspects dynamique et contextuel de la connaissance. Pour que la machine puisse jouer un tel rôle pro-actif dans la construction, il faut concevoir un algorithme d'extraction de motifs temporels à partir de traces qui soit complet et qui permette de fournir des motifs en temps réel à l'humain, de sorte que le processus prenne la forme d'un dialogue avec la machine. Une chronique est une structure de motif spécifiant des contraintes temporelles numériques. L'algorithme d'extraction de chroniques fréquentes que nous présentons dans cette thèse pour implémenter ce processus est le premier algorithme d'extraction complète de chroniques à partir de séquences d'événements. Il permet l'interactivité en temps réel avec son utilisateur en affichant les résultats partiels de l'extraction à tout moment. L'algorithme supporte l'intégration de plusieurs types de contraintes temporelles et structurelles permettant à l'utilisateur de faire converger la découverte plus rapidement vers les chroniques d'intérêt. L'algorithme se comporte comme un framework dans la mesure où il peut être configuré pour agir comme les algorithmes d'extraction de chroniques non complets existants, pour découvrir l'ensemble véritablement complet des chroniques fréquentes, ou encore l'ensemble complet des épisodes hybrides fréquents, une certaine forme résumée et simplifiée des chroniques. Lorsqu'il est comparé aux algorithmes existants dans les mêmes conditions, notre algorithme montre des performances tout à fait comparables. L'inconvénient du problème de découverte de chroniques est que l'espace d'exploration s'agrandit exponentiellement avec la longueur des chroniques, si bien qu'il n'est possible de découvrir que des chroniques de faibles longueurs, introduisant la nécessité de réaliser la découverte de manière incrémentale. La plate-forme Scheme Emerger, développée dans le cadre de cette thèse, implémente cet algorithme et une interface graphique de pilotage. Scheme Emerger illustre le processus de co-construction de connaissances proposé sur des traces d'activités collaboratives collectées dans la plate-forme CollaborativeECM, développée dans le cadre du projet PROCOGEC.
Fichier non déposé

Dates et versions

hal-01465706 , version 1 (13-02-2017)

Identifiants

  • HAL Id : hal-01465706 , version 1

Citer

Damien Cram. Découverte interactive et complète de chroniques : application à la co-construction de connaissances à partir de traces. 2010. ⟨hal-01465706⟩
124 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More