Découvertes de motifs pertinents pour l'analyse du transcriptome : application à l'insulino-résistance - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2005

Découvertes de motifs pertinents pour l'analyse du transcriptome : application à l'insulino-résistance

Résumé

Modern experimental techniques enable to gather huge amounts of biological data in a single experiment (e. G. , DNA microarray) and old ways of dealing with data item by item are no longer sustainable. To support knowledge discovery, data mining techniques are crucially needed. Focusing on gene expression data analysis, we propose to extract relevant biological hypothesis from set patterns. We developed a new constraint-based algorithm which computes complete collections of formal concepts satisfying user-defined constraints. We used this algorithm on an original dataset such that new genes regulated by a combination of transcription factors involving the SREBP1 have been found. A fundamental limitation of formal concept discovery concerns its sensitivity to noise. Therefore, we have designed new fault-tolerant pattern types to enhance the applicability of our methodology in various real-life contexts.
Les nouvelles technologies expérimentales (e. G. , puce à ADN) permettent de collecter de très grands volumes de données. Les méthodes classiques d'analyse de données ne peuvent plus s'appliquer et il y a un besoin crucial en méthodes de fouille de données pour assister les processus d'extraction de connaissances. En s'intéressant à l'analyse de données transcriptomiques, nous proposons d'extraire des hypothèses biologiquement pertinentes au moyen de motifs ensemblistes. Nous avons développé un nouvel algorithme complet d'extraction de tous les concepts formels qui satisfont des contraintes fixées par l'utilisateur. Nous l'avons utilisé sur des données originales et avons identifié de nouveaux gènes cibles du facteur de transcription SREBP1. L'extraction de concepts formels est très sensible au bruit et nous avons étudié leurs extensions pour une gestion maîtrisée des exceptions. Nous améliorons ainsi la portée de notre méthode d'analyse dans des contextes réalistes.
Fichier non déposé

Dates et versions

hal-01455304 , version 1 (03-02-2017)

Identifiants

  • HAL Id : hal-01455304 , version 1

Citer

Jérémy Besson. Découvertes de motifs pertinents pour l'analyse du transcriptome : application à l'insulino-résistance. 2005. ⟨hal-01455304⟩
57 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More