Thèse de Johan Leydet
Sujet :
Date de début : 18/01/2023
Date de fin (estimée) : 18/01/2026
Encadrant : Elod Egyed-Zsigmond
Co-encadrant : Pierre-Edouard Portier, Diana Nurbakova
Résumé :
Johan Leydet va travailler sur l’extraction de connaissances à partir de textes. Il s’agit d’étudier l’identification et caractérisation des entités (tels que noms de personnes, lieux, organismes, …) ainsi que les relations entre ces entités. L’extraction d’autres types de connaissances, type de rhétorique, arguments fait également partie des sujets de la thèse.
Un premier objectif de la thèse est la création (éventuellement assistée) d’un jeu de documents dans lesquels les entités et les relations entre-elles sont identifiés et annotées. Cet objectif implique l’étude des jeux de documents annotés existants ainsi que l’étude des méthodes d’annotation assistée de documents.
Un second objectif est de mettre en place des modèles qui permettent l’identification et annotation des entités et leur mise en relation de manière automatique.
Le troisième objectif de la thèse est la réutilisation des annotations et des liens identifiés entre entités pour extraire des connaissances sur le type de la rhétorique et d’éventuels arguments ) partir des textes.