Thèse de Fatemeh Ansari

Sujet :

Contribution à la détection automatique des cas de harcèlement sur les Webs sociaux

Date de début : 04/02/2019
Date de soutenance : 25/02/2024

Encadrant : Djamal Benslimane
Co-encadrant : Mahmoud Barhamgi

Résumé :

Le but de cette thèse est de construire une approche avancée pour extraire et analyser des données massives et complexes à partir du Web social pour une détection de cyber harcèlement. De telles données seront utilisées pour des besoins d’une analyse prédictive. Par conséquent, ce travail de recherche est conçu pour développer des outils efficaces afin d’extraire des données pertinentes, en mettant l'accent sur la découverte de connaissances de haut niveau telle que la prédiction des comportements violents et la reconnaissance des cas de harcèlement.

Nous allons poursuivre notre objectif en effectuant les tâches suivantes :

Proposer une approche qui permet de prendre en compte des défis majeurs du Web social :
1. l’évolution dans le temps du comportement des utilisateurs du Web social.
2. l’aspect multidimensionnel des données issues des interactions des internautes. En effet, l’évolution continue du comportement de chaque profil sur l’axe du temps nous invite à explorer les modèles graphiques tels que les modèles de Markov ou les champs aléatoires conditionnels (CRF). Nous allons explorer l’utilisation du Web Sémantique (ex., les ontologies de domaines et les mécanismes d’inférences associés) pour la modélisation des comportements violents et du phénomène de cyber harcèlement.
Concevoir un algorithme capable de détecter la violence en liant les comportements violents aux profils des utilisateurs. Cet algorithme se basera sur plusieurs patterns textuels caractérisant la violence en plus des fréquences comme la répétition des propos intimidants dans un message textuel. Dans ce contexte, les relations de causalités probabilistes ainsi que les règles d’associations seront étudiées. L’étendu de l’analyse ira jusqu’à l’exploration de la topologie du réseau et la propagation d'information en son sein dans le but de la détection des profils dangereux.
Concevoir un algorithme pour détecter la menace unitaire. Les comportements violents visent en général une catégorie spécifique d'utilisateurs. En revanche, ils sont exprimés de différentes manières et par le biais de divers moyens comme des messages textuels, des images ou encore des vidéos. De ce fait, la catégorisation des profils sur les plateformes d’échanges constituera un aspect très important de cette recherche, or une victime peut être un utilisateur, tout comme un groupe d’utilisateurs ou encore une communauté toute entière.
La mise en place d’un cadre de travail (framework) permettant de valider la solution proposée sur une étude de cas réel. Par exemple, la mise en place d’extension logicielle (i.e., plugin) sur une des applications de réseaux sociaux (ex. Facebook) permettant aux parents d’être notifiés quand leurs enfants mineurs sont harcelés par des individus violents.

L’approche et les algorithmes à proposer prendront en considération la voluminosité des données dans le contexte du Web social et la dynamicité des attributs du système dans le temps.