Prix du meilleur article à WEBIST 2019
Cet article présente une plateforme pour la classification binaire assistée de très grands collections de documents composés de texte et d’images. L'objectif est de permettre aux utilisateurs de classer des grandes collections de manière assistée, avec une interface utilisateur graphique, en un nombre de clics humainement acceptable. L'article propose également une nouvelle stratégie de requête dans le contexte de l’Apprentissage Actif, en prenant en compte le contenu en double non étiqueté et le contenu dupliqué (par exemple, re-tweeté) dans le corpus cible à classer. Ces contributions s'appuient sur un outil de code librement accessible et sur une évaluation de l'impact de l'utilisation des méthodes susmentionnées sur le nombre de clics nécessaires pour atteindre un niveau de précision stable.
Code open source : https://bitbucket.org/idenum/cati/wiki/Home
Site Web avec la mention du prix: http://www.webist.org/PreviousAwards.aspx
CATI: Assisted Classification of Documents (text and images)