Thèse de Lu Gan


Sujet :
Vers des systèmes de recommandation diversifiés

Résumé :

Les systèmes de recommandation sont très largement utilisés, et populaires, dans de nombreux domaines :  e-commerce, plateformes en ligne de partage et de vente de musique et de films, ou encore réseaux sociaux. Les systèmes de recommandation existants sont majoritairement orientés qualité de prédiction et fonctionnent relativment bien dans ce cadre. Néanmoins, alors que l'utilisation des systèmes de recommandation se généralise à d'autres domaines plus sensibles (santé, géo-localisation), les traitement et l'utilisation de données personnelles posent des problèmes relatif au respect de la vie privée et à la protection de ces données. L'évaluation des systèmes existants ne tient généralement compte  que de la qualité de prédiction de ces systèmes, ce qui n'est pas suffisant au regard de ces problèmes.

Récemment, la communauté s'est intéressée aux problématiques d'équité, de diversité, d'interprétabilité et de transparence en recherche d'information pour pallier les limitations des systèmes existants. L'équité et la diversité ont pour objectif de proposer à l'utilisateur des résultats variés et non discriminatoires, en réduisant et en évitant les effets de biais (biais de sélection, biais de genre, etc) et les phnomènes de "filter bubbles". Interprétabilité et transparence ont quant à elles pour objectif de rendre le fonctionnement d'un système (traitement des données, apprentissage des modèles, sélection des résultats présentés) plus compréhensible pour un utilisateur, permettant ainsi de renforcer la confiance de l'utilisateur envers le système et de fournir des garanties quant à la protection des données. Les approches actuelles intègrent généralement l'une ou l'autre de ces notions, mais à notre connaissance, aucune approche ne prend en compte l'intégralité de ces problématiques.

L'objectif de cette thèse est d'aborder l'aspect de diversité de la recommandation. Nous étudions quels effets sur la diversité peuvent être apportés par les techniques de graphes de connaissances, comment atteindre le meilleur compromis précision-diversité tout en considérant non seulement les interactions historiques utilisateur-item mais aussi les informations auxiliaires sur les items. Nous explorons l'utilisation de processus ponctuels déterminants (DPP) pour obtenir un meilleur compromis précision-diversité.
 

Pour l'évaluation, nous utilisons des ensembles de données du monde réel : MovieLens et Anime, et évaluons l'efficacité des approches proposées de trois points de vue : précision, diversité, compromis précision-diversité.

 


Encadrant : Léa Laporte
Co-direction : Sylvie Calabretto, Diana Nurbakova

Date de soutenance : lundi, 30 mai, 2022

Jury :
Mme Boyer AnneProfesseur(e)Université de LorraineRapporteur(e)
Mme Soule-Dupuy ChantalProfesseur(e)Université Toulouse 1 CapitoleRapporteur(e)
Mr Bellot PatriceProfesseur(e) associé(e)Aix-Marseille UniversitéExaminateur​(trice)
Mr Kamps JaapProfesseur(e) associé(e)University of AmsterdamExaminateur​(trice)
Mme Calabretto SylvieProfesseur(e)INSA LyonDirecteur(trice) de thèse
Mme Nurbakova DianaMaître de conférenceINSA LyonCo-directeur (trice)