Thèse de Lucas Foulon


Sujet :
Détection d'anomalie dans les flux temps réel sol-bord de la SNCF

Résumé :

La SNCF produit et exploite dans son système d'informations une grande quantité de données hétérogènes récoltées en temps réel.
Certaines d'entres elles proviennent du SI au sol, notamment les informations voyageurs, et d'autres arrivent du bord, via les trains dits communicants.
On peut y trouver des informations telles que les prochains départs et les perturbations au sol, ou les données de géo-localisations et de télé-maintenance à bord.
Tous ces flux sont collectés en temps réel, agrégés, uniformisés et diffusés par des plateforme dites de médiation. Ils sont émis par différents types d'équipements à bord, circulent entre et traversent différentes plateformes au sol, avant d'arriver sur les applications clients.
Ces flux nécessitent une supervision de bout-en-bout en temps réel, pour observer le bon fonctionnement de l'infrastructure et les nombreuses variations dans le trafic de données.
Ces variations sont causées par la dynamique des données récoltées (eg, perturbation de trafic), ou sont liées à l'infrastructure de collecte et de communication utilisée pour traiter et faire transiter ces données.
C'est sur ce dernier point, à savoir les anomalies techniques de l'infrastructure, et non les perturbations métier, que la thèse s'articule.
En effet, lorsqu'une anomalie de ce type se produit, le temps de constatation de l'anomalie peut atteindre plusieurs jours, voire plusieurs semaines, et le temps nécessaire pour déterminer la cause, dans l'objectif de résoudre l'anomalie, peut être encore plus long.
Cette thèse s'inscrit dans la continuité d'un stage de Master 2 dans lequel une première modélisation des flux et un algorithme de détection d'anomalies ont été mis en place pour le flux de géolocalisation.
L'objectif de cette thèse étant d'obtenir un modèle dynamique complet de la normalité des flux, capable de s'adapter aux changements de régimes dans les flux temps-réels, grâce aux connaissances théoriques sur le réseau et de son activité normal, tout en modélisant les relations de corrélations et de causalité entre les différents indicateurs, dans le but de détecter les anomalies, perçues comme des écarts par rapport à la normalité, les prévenir et les localiser.


Encadrant : Serge Fenet
Co-encadrant : Christophe Rigotti