Thèse de Hatem Mousselly-Sergieh


Sujet :
Annotation automatique d’images à l’aide de photos géo localisés communautaires

Date de soutenance : 26/09/2014

Encadrant : Jean-Marie Pinon
Co-encadrant : Elod Egyed-Zsigmond

Résumé :

La technologie Web 2.0 a donné lieu à un large éventail de plates-formes de partage de photos. Il est possible de télécharger des images et de les annoter de manière collaborative avec des mots clés, afin de permettre la gestion et la recherche efficace. Toutefois, l’annotation manuelle est laborieuse et chronophage. Au cours des dernières années, les quantités grandissantes des photos annotés accessibles sur le Web ont attiré l'attention des chercheurs travaillant sur des méthodes d'annotation d'image automatique . Contrairement aux approches traditionnelles, qui se reposent sur la modélisation statistique et l'apprentissage automatique, la nouvelle direction de recherche, appelé aussi annotation d’images basée sur la recherche, a montré de meilleures performances. L'idée est d'identifier pour une photo non annotée, un ensemble d'images visuellement similaires dans une base d'images déjà annotées en utilisant des algorithmes de traitement d’image. Par la suite, les annotations des images similaires sont récupérées comme des annotations pour l'image non annotée.
Actuellement, un nombre considérable de photos communautaires sont associés à des informations de localisation, elles sont géolocalisées. Dans cette thèse, nous exploitons ce contexte riche, les algorithmes et des modèles statistiques pour l'annotation automatique d'images en suivant le paradigme basée sur la recherche. L'objectif est de répondre aux principales limites des approches de l'état de l'art en termes de la qualité des annotations produites et la rapidité du processus d'annotation complète. Tout d'abord, nous présentons une méthode de collecte de données à partir du Web sur la basé sur la localisation. Ainsi, nous mettons l'accent sur la qualité et la représentativité spatiale des données. Pour assurer la qualité de l’annotation, une nouvelle approche pour résoudre l'ambiguïté inhérente de tags utilisateur est proposée. L'approche démontre l'efficacité de l'algorithme de recherche de caractéristiques discriminantes dite de Laplace pour améliorer la représentation de l'annotation. En outre, il présente une nouvelle mesure de distance entre mots clés en étendant la divergence Jensen - Shannon pour tenir compte des fluctuations statistiques. Pour identifier des images similaires pour une photo sans annotation, nous exploitons également des informations de localisation afin réduire l'espace de recherche. En outre, la thèse étudie des méthodes pour améliorer la précision et réduire le temps d'exécution de recherche d’images similaires. Une solution pour accélérer l'appariement d'images se basant des points d éintérêt ( SURF ) est introduite. L'approche présente un modèle pour identifier les points-clés de SURF saillants en utilisant des techniques de classification. En filtrant les ponts d’intérêt avent la comparaison des images améliore le rendement. Une méthode pour améliorer la précision de SURF basé sur le couplage itératif et un algorithme de classification de points d’intérêt est proposée. Enfin, l'efficacité de l'approche d'annotation proposée dans son ensemble et l'efficacité des contributions individuelles est démontrée expérimentalement par des études d'évaluation complètes.