Formalisme statistique pour ensembles de structures discrètes - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2009

Statistical formalism for sets of discrete structures

Formalisme statistique pour ensembles de structures discrètes

Résumé

In pattern recognition, the coding of information extracted from the data is a decisive phase, and the use of structures seems to be the most pertinent choice. However, the coding in the form of numeric feature vectors offers the advantage of enabling, in the sequel, the use of numerous efficient algorithms specifically developed for the classification of numeric vectors in fields connected to pattern recognition. From this observation was born a research field devoted to the statistical characterization of structure spaces. At the same time have been developed a set of works based on a transformation of structures into numeric vectors. Finally, probabilities are a widely used paradigm for the classification of structured data, via the modelling of distributions of structures and a massive use of the maximum likelihood classifier. In this thesis, we propose the translation to structure spaces of criteria enabling to define the statistical notions of uniformity and normality of probability laws. We propose as well a reflection on the definition of structural random variables taking their values in a vector space, having in prospect the possibility of applying, in the structural domain, the central limit theorem, a fundamentally important result in probability theory and statistics. From an applicative point of view, we evaluate the contribution of a part of our work for the resolution of typical problems in pattern recognition, namely the classification of DNA sequences and the classification of images of handwritten digits.
En reconnaissance de formes, le codage de l'information extraite des données est une étape décisive, et l'utilisation de structures semble être le choix le plus pertinent. Cependant, le codage sous forme de vecteurs de caractéristiques numériques offre l'avantage de permettre l'utilisation de nombreux algorithmes efficaces développés spécifiquement pour la classification de vecteurs numériques dans des disciplines connexes à la reconnaissance de formes. De ce constat est né un champs de recherche dédié à la caractérisation statistique des espaces de structures. Parallèlement, ont vu le jour un ensemble des travaux basés sur une transformation des structures sous forme de vecteurs numériques. Enfin, les probabilités sont un paradigme largement utilisé pour la classification de données structurées, via la modélisation de distribution de structures et l'utilisation massive du classifieur par maximisation de vraisemblance. Dans cette thèse, nous proposons la traduction aux espaces structurels de critères permettant de définir les notions statistiques d'uniformité et de normalité de lois de probabilités. Nous proposons également une réflexion sur la définition de variables aléatoires de structures à valeur dans un espace vectoriel, avec pour perspective la possibilité d'application, dans le domaine structurel, du théorème central limite, résultat d'importance fondamentale en théorie des probabilités et statistique. D'un point de vue applicatif, nous évaluons les apports d'une partie de nos travaux pour la résolution de problèmes typiques en reconnaissance de formes, à savoir la classification de séquences d'ADN et la classification d'images de chiffres dessinés à la main.
Fichier non déposé

Dates et versions

hal-01459802 , version 1 (07-02-2017)

Identifiants

  • HAL Id : hal-01459802 , version 1

Citer

Sébastien Rebecchi. Formalisme statistique pour ensembles de structures discrètes. 2009. ⟨hal-01459802⟩
130 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More