Thèse de Aurélie Leborgne


Sujet :
Analyse de formes : segmentation et extraction de caractéristiques

Date de soutenance : 11/07/2016

Encadrant : Laure Tougne Rodet
Co-encadrant : Julien Mille

Résumé :

Des recherches effectuées au sein du laboratoire LIRIS portent sur
l’analyse de formes extraites dans des images. Le LIRIS est notamment
porteur du projet ANR ReVeS, dont l’objectif est de développer une
application de reconnaissance de végétaux sur Smartphone. Dans le cadre
de ce projet, des études sont notamment menées sur la segmentation des
images acquises par le Smartphone et sur l’extraction de la forme
générale du végétal à reconnaître, en particulier des feuilles. Le
laboratoire LIRIS étudie donc des méthodes d’analyse de formes qui
pourraient, entre autres, s’appliquer à la reconnaissance de végétaux.
Celle-ci peut s’effectuer en environnement naturel, comme les forêts ou
les prairies (auquel cas l’espèce provient de la flore locale) mais aussi en
environnement urbain/péri-urbain, comme les jardins privés ou publics, les
parcs (dans ce cas, il peut s’agir d’espèces importées) Ce sujet s’intègre
donc dans les thématiques abordées dans le LabEx IMU.
Les formes planes font l’objet de nombreux travaux, s’appuyant sur
des concepts de reconnaissance de formes (classification, analyse de
données, statistique, etc.) et de géométrie (discrète, continue,
algorithmique, etc.). D’une part, ces recherches portent sur la
représentation des formes, contexte dans lequel on cherche à caractériser
la forme en termes de descripteurs, de manière à en avoir une description
à la fois concise et la plus représentative possible. Parmi les exemples de
descripteurs basiques, on peut citer l’aire, la compacité, la courbure
moyenne (de par leur simplicité et leur généralité, ces descripteurs
peuvent ne pas être pertinents dans les cas pratiques et on s’intéresse
souvent à des caractéristiques plus complexes). D’autre part, les
recherches actuelles sur les formes planes ont également pour sujet leur
classification et leur analyse statistique. Ces objectifs impliquent
d’effectuer des comparaisons, plus précisément de quantifier la
ressemblance entre deux formes. Il est alors nécessaire d’avoir des
mesures de similarité, qui devront le plus souvent respecter la propriété
d’invariance par rapport à certaines transformations. Par exemple, la
rotation est une transformation à laquelle l’invariance est généralement
souhaitée, une mesure pertinente devant indiquer une similarité maximale
entre une forme et la même forme tournée d’un angle quelconque. En plus
de mesurer la similarité, il est également utile de pouvoir combiner deux
formes ou plus, à l’aide de méthodes d’interpolation. Par exemple,
l’extraction de mesures statistiques sur un ensemble de formes
semblables mais non identiques peut impliquer le calcul d’une moyenne
de formes, cette dernière pouvant être considérée comme représentative
de l'ensemble de formes.
L’interpolation de deux formes est effectuée soit dans l’espace des
descripteurs, extraits lors d’une phase de caractérisation, abordée au
paragraphe précédent, soit directement sur la forme elle-même. Dans le
cadre de cette thèse, on se propose de travailler dans l'espace des formes
et de mettre en évidence des représentants d'ensemble d'objets plans.
Pour cela, il existe différentes représentations de forme possibles. Dans
une représentation de type contour, les algorithmes travaillent sur des
structures représentant le chainage de points successifs sur la frontière de
l’objet. On peut alors choisir de représenter le contour à l’aide d’un
polygone (une suite de sommets à coordonnées réelles espacés de
manière arbitraire), soit à l’aide d’une courbe discrète (une suite de pixels
adjacents, à coordonnées entières). Dans une représentation de type
région, les algorithmes manipulent des ensembles discrets (et le plus
souvent connexes) de pixels à l’intérieur de la forme. Dans cette thèse, on
étudiera des méthodes de combinaison qui pourront utiliser des aspects
contour et/ou région.
Bien souvent, les formes planes étudiées sont le résultat d’une
phase d’analyse d’image, lors de laquelle un objet est extrait à partir de
l’image. Cette étape, dite de segmentation, génère des formes
éventuellement bruitées ou incomplètes, suivant les différents
phénomènes pouvant perturber la qualité de l’image (bruit, flou,
occultations partielles, etc.). On s’intéressera donc dans un premier temps
à des méthodes de segmentation pouvant intégrer des connaissances a
priori afin de limiter les erreurs dus à ces phénomènes. Dans un second
temps, nous étudierons des méthodes de combinaisons de formes prenant
en compte le bruit ou les parties manquantes.