Thèse de Felix Bölz


Sujet :
Systèmes de recommandation de nourritures intégrant la santé, explicabilité et incitant le changement de comportement

Date de début : 01/12/2021
Date de fin (estimée) : 01/12/2024

Encadrant : Lionel Brunie
Co-encadrant : Diana Nurbakova
Co-direction : Sylvie Calabretto
Co-tutelle : Harald Kosch

Résumé :

Le problème de surpoids et obésité touche des milliards d’adultes. En limitant le champ d’actions à la nutrition, l’aide doit offrir des conseils diététiques faciles à intégrer au quotidien. Les recommandations de repas pour toute la journée qui tiennent compte de conditions de santé d’usagers doivent intégrer les préférences des utilisateurs, les objectifs nutritionnels et le contexte quotidien (p. ex., l’heure et la date). Cependant, les jeux de données de recettes et les systèmes de recommandation existants manquent souvent de lignes directrices générales de santé, capturent mal les interactions utilisateur-produit, ou ne fournissent pas d’explications ni d’autres méthodes de persuasion pour améliorer l’efficacité des recommandations. Cette thèse comble ces lacunes et évalue des systèmes proposés pour la planification de repas en tenant compte de l’état de santé. Nous présentons un état-de l’art approfondi sur la nutrition et sur la persuasion, un aperçu des LLM, et les travaux connexes en matière de jeux de données et d’approches de recommandation. Ensuite, nos contributions se déclinent en trois parties.

Notre première contribution est HUMMUS, un grand graphe alimentaire lié, incluant environ 500 000 recettes, 300 000 utilisateurs, 1, 9 million d’interactions, des scores nutritionnels et des liens sémantiques vers FoodOn (hiérarchie de produits alimentaires) et FoodData (ingrédients nutritionnels et données de produits). Elle permet de raisonner sur des classes d’ingrédients et de vérifier des nutriments. Sa taille, la présence d’interactions et la diversité des informations nutritionnelles améliorent l’utilisabilité par rapport aux jeux de données connexes. Nous discutons de la parcimonie des données (sparsity), du prétraitement et des options de filtrage qui soutiennent différents protocoles expérimentaux.

Notre deuxième contribution est une étude des comportements centrés sur l’alimentation. Nous avons collecté des questionnaires et des journaux alimentaires via une application en ligne afin d’explorer les corrélations entre compétences alimentaires (FS), compétences culinaires (CS) et contexte de consommation. L’échantillon comprend 78 participants. Les résultats montrent que FS et CS sont corrélés. Ces constats et l’application utilisée aident à explorer le domaine des comportements alimentaires et à améliorer les études et systèmes de recommandation futurs.
 

Notre troisième contribution est un cadre pour la recommandation quotidienne de menus pour la journée, y compris des explications. Nous concevons et mettons en oeuvre deux approches acceptant des entrées en langage naturel. La première, un système KBQA, recommande des menus journaliers, gère plusieurs contraintes nutritionnelles et produit des explications étayées par des chemins. Elle étend la base PFoodReq par ces fonctions, mais en hérite aussi des problèmes d’évolutivité et applique des contraintes souples. Nous proposons ensuite l’architecture FoodRAG, un pipeline modulaire, agentique et basé sur des LLM, qui réalise la recherche de recettes, la validation, la substitution d’ingrédients et l’explication pas à pas. Malgré un coût de calcul supérieur aux lignes de base, sa grande adaptabilité produit des recommandations de menus de repas plus ciblées. Les deux systèmes sont évalués et comparés à des approches de référence (collaboratives et basées sur le contenu). La persuasion est abordée via l’intégration de mécanismes de gamification adaptés, la génération d’explications et des aides génériques d’interface. Comme les méthodes collaboratives performent mal sur des données éparses telles que HUMMUS, nous évaluons des bases de référence simples basées sur le contenu, le système KBQA et trois variantes de FoodRAG. Le système de recherche Text-to-Pandas (un LLM qui transforme des questions en langage naturel en requêtes Pandas exécutées sur le jeu de données de FoodRAG) donne les meilleurs résultats de recherche de recettes.