Thèse de Nathan Quiblier
Sujet :
Date de début : 26/10/2021
Date de fin (estimée) : 26/10/2024
Encadrant : Hugues Berry
Résumé :
La compréhension de la façon dont les facteurs de transcription explorent le noyau pour trouver leurs sites de liaison constitue toujours un goulot d'étranglement dans notre compréhension de l'expression génétique. Un exemple est la libération de la pause transcriptionnelle, une étape cruciale de la transcription, la génération d'ARN complémentaire à partir de l'ADN par la polymérase II (Pol II). Lors de l'engagement du processus de transcription, la moitié des molécules de Pol II reste bloquée aux sites de pause, ce qui interrompt effectivement la transcription. Le facteur critique qui déclenche la libération de cette pause est P-TEFb (pour Positive Transcription Elongation Factor b), qui phosphoryle la Pol II, la libérant ainsi de son état de pause. Cependant, on ne sait pas exactement comment le P-TEFb trouve les molécules de Pol II dans le noyau. Quels sont les facteurs qui déterminent le mouvement de P-TEFb : l'encombrement moléculaire et sa distribution spatiale ? la liaison à des sites non spécifiques de l'ADN ? la liaison à des partenaires protéiques ? ou d'autres mécanismes ?
Les approches expérimentales actuelles sont entravées par leur échelle spatio-temporelle limitée et la complexité de l'organisation nucléaire. Nous proposons de surmonter ce défi en combinant les simulations informatiques et la microscopie. Les partenaires expérimentaux du consortium (I. Izeddin Paris ; L. Héliot Lille ; X. Darzacq Berkeley USA) développent des approches expérimentales basées sur la microscopie à super-résolution pour cartographier la dynamique spatio-temporelle de P-TEFb dans le noyau de cellules vivantes. Le partenaire de modélisation (H. Berry, Inria Lyon) les complète par une approche de simulation basée sur le calcul bayésien approximatif (ABC) avec des simulations de Monte-Carlo de la diffusion de P-TEFb dans des modèles informatiques de plus en plus réalistes du noyau.
Le projet de recherche doctoral sera à l'origine de l'effort de modélisation du projet et initiera le développement du code ABC basé sur la méthode Monte-Carlo (mouvement brownien 3d et modèles connexes, modélisation des signaux de microscopie). Le code permettra également de sélectionner le modèle, c'est-à-dire de produire des estimations sur le modèle microscopique susceptible d'être en jeu dans la cellule. Un aspect clé du projet est l'efficacité du code, car l'ABC nécessite généralement des millions de simulations. Pour cette raison, le code de simulation sera développé en C++, sur la base d'un prototype existant développé au laboratoire. Pour accélérer l'exécution, un effort important sera consacré à l'optimisation et à la parallélisation pour l'exécution sur un cluster d'ordinateurs, y compris sur les nouveaux cœurs multi/many et les processeurs GPU.
En parallèle, le doctorant développera des outils mathématiques pour prédire le comportement à gros grains des modèles microscopiques mis en œuvre. À cette fin, la limite de champ moyen de ces modèles sera étudiée, par exemple en utilisant un formalisme basé sur des EDP structurées en âge.