Thèse de Johan Leydet


Sujet :
Extraction de connaissances à partir de textes

Date de début : 18/01/2023
Date de fin (estimée) : 18/01/2026

Encadrant : Elod Egyed-Zsigmond
Co-encadrant : Pierre-Edouard Portier, Diana Nurbakova

Résumé :

Johan Leydet va travailler sur l’extraction de connaissances à partir de textes. Il s’agit d’étudier l’identification et caractérisation des entités (tels que noms de personnes, lieux, organismes, …) ainsi que les relations entre ces entités. L’extraction d’autres types de connaissances, type de rhétorique, arguments fait également partie des sujets de la thèse.

Un premier objectif de la thèse est la création (éventuellement assistée) d’un jeu de documents dans lesquels les entités et les relations entre-elles sont identifiés et annotées. Cet objectif implique l’étude des jeux de documents annotés existants ainsi que l’étude des méthodes d’annotation assistée de documents.

Un second objectif est de mettre en place des modèles qui permettent l’identification et annotation des entités et leur mise en relation de manière automatique.

Le troisième objectif de la thèse est la réutilisation des annotations et des liens identifiés entre entités pour extraire des connaissances sur le type de la  rhétorique et d’éventuels arguments ) partir des textes.