Thèse de Sara Makki


Sujet :
An Efficient Classification Model for Analyzing Skewed Data to Detect Frauds in the Financial Sector" (Un Modèle de Classification Efficace pour l'Analyse des Données Déséquilibrées pour Détecter les Fraudes dans le Secteur Financier.)

Date de soutenance : 20/12/2019

Encadrant : Mohand-Said Hacid

Résumé :

Il existe différents types de risques dans le domaine financier, tels que le financement du terrorisme, le blanchiment d’argent, la fraude de cartes de crédit qui sont généralement détectés à l'aide d'algorithmes de classification. Dans les problèmes de classification, la distribution asymétrique des classes, également connue sous le nom de déséquilibre de classe, est un défi très commun pour la détection des fraudes.

Nous avons développé deux approches : Un k plus proches voisins sensibles aux coûts basé sur la mesure cosinus (CoSKNN) en tant que classifieur unique, et une approche hybride de classification déséquilibrée basée sur l’algorithme k-modes (K-MICHA) en tant que méthodologie d'apprentissage ensembliste. K-MICHA a pour objectif de regrouper des points de données similaires en termes de résultats de classifieurs. Ensuite, calculez les probabilités de fraude dans les groupes obtenus afin de les utiliser pour détecter les fraudes de nouvelles observations

Nous avons appliqué K-MICHA à des données de fraude par carte de crédit, paiement mobile et assurance automobile. Dans les trois études de cas, nous comparons K-MICHA au stacking en utilisant le vote, le vote pondéré, la régression logistique et l’algorithme CART. Nous nous sommes également comparés à Adaboost et à la forêt aléatoire. 

Mots clés: Fraude financière, Déséquilibre de classe, Score F1, Classification sensible aux coûts, Mesure de cosinus, K plus proche voisins, Apprentissage ensembliste, k-modes.

 

Jury :
Mme Murisasco ElisabethProfesseur(e)Université de ToulonRapporteur(e)
Mme Soule-Dupuy ChantalProfesseur(e)Université ToulouseRapporteur(e)
M. Boucelma OmarProfesseur(e)Université Aix-Marseille Examinateur​(trice)
Mme Assaghir ZainabProfesseur(e) associé(e)Université LibanaiseExaminateur​(trice)
M. Taher YehiaMaître de conférenceUniversité de VersaillesExaminateur​(trice)
Mme Seba HamidaMaître de conférenceLIRIS - Université Claude Bernard Lyon 1Examinateur​(trice)
M. Hacid Mohand-SaïdProfesseur(e)LIRIS - Université Claude Bernard Lyon 1Directeur(trice) de thèse
M. Zeineddine HassanProfesseur(e)Université LibanaiseDirecteur(trice) de thèse
M. Haque Akm RafiqulDirecteur(trice) de rechercheCognitus Invité(e)