Thèse de Sonia Yousfi


Sujet :
Détection et reconnaissance de textes Arabes incrustés dans les vidéos

Date de soutenance : 06/07/2016

Encadrant : Christophe Garcia
Co-encadrant : Stefan Duffner

Résumé :

Les vidéothèques numériques connaissent de nos jours une croissance énorme avec les outils de partage vidéo, la délinéarisation des programmes TV et les systèmes de vidéo à la demande. Représenter, chercher et récupérer un tel type de données est devenu assez important et demande l’exploitation de toute information disponible à l’intérieur ou à l’extérieur de la vidéo. Le texte incrusté, artificiellement ajoutée à une vidéo, comme les noms des lieux et les sous-titres des journaux télévisés, est l’un des sémantiques de haut niveau les plus utilisées dans la structuration et la récupération des vidéos.
Dans cette thèse, nous nous sommes intéressés à la détection et à la reconnaissance du texte Arabe incrusté dans les vidéos. L’accent est mis sur le texte Arabe en particulier pour plusieurs raison. Premièrement, cette langue est utilisée par plus de la moitié d'un milliard de personnes dans le monde et les deux dernières décennies ont connu l’apparition de plusieurs chaînes Arabes très grandes et populaires. Deuxièmement, le texte Arabe présente plusieurs spécificités qui rendent sa détection et sa reconnaissance, en deuxième lieu, très difficiles (texte cursif, des formes plus variées que les textes Latin et Chinois, etc.).
Dans cette thèse, la première étape consiste à proposer une méthode de détection du texte Arabe incrusté dans les vidéos qui le sépare du fond et le localise précisément dans chaque trame. Ensuite, la deuxième étape consiste à reconnaitre ce texte avec des approches à base d’apprentissage automatique principalement. Le système d’OCR Arabe final (Optical Character Recognition) doit être robuste aux variabilités du texte ( fonte, taille, couleur, etc.) et des conditions d’acquisition (faible résolution, fond complexe, luminosité non uniforme, etc.).