User Tools

Site Tools


Sidebar

Practical Information:

Teaching:

Bâtiment Nautibus
43, Bd du 11 Novembre 1918
69622 Villeurbanne Cedex.
☏: +33(0)472 43 16 35
email: marc.plantevit-at-univ-lyon1.fr

Research:

Bureau 501.319
Bâtiment Blaise Pascal
7, Avenue Jean Capelle
69621 Villeurbanne Cedex
☏: +33(0)472 43 84 87
Fax: +33(0)472 43 87 13
email: marc.plantevit-at-liris.cnrs.fr

prim1516gazouille_comm

Détection d'événements dans medias sociaux géolocalisés

Contexte

Les réseaux sociaux (e.g., Twitter, Instagram, …) sont des riches sources d'informations qui sont utilisées dans un nombre très important d'applications dédiées ou des services pour des utilisateurs (b2c), pour des compagnies par l'intermédiaire de plateformes analytiques (b2b), mais aussi pour aider des gouvernements et des organisations non gouvernementales. A travers plusieurs APIs publiques, on peut accéder à des flux de messages qui sont souvent composés de texte (incluant hashtags, user mentions et URIs), de médias (images, vidéos) et sont géolocalisés, donnant la position de l'auteur du message (appelé post dans la suite). Une façon de tirer partie de ces données très volumineuses est de découvrir les tendances globales et de détecter des événements dans le flux des posts. Les motivations sont multiples : détection de désastre météorologique, identification de news qui pourraient apparaître plus lentement dans les médias traditionnels, identification de tendances, étude de la perception d'une marque, etc.

Existant

Dans ce contexte, l'équipe DM2L du LIRIS a développé Gazouille, une plateforme d'analyse de médias sociaux géolocalisés afin de détecter en temps réel des événements (e.g., concerts, matchs, manifestations, bouchons, accidents, etc.). De très nombreux événements peuvent être détectés, un événement réel (e.g. match de foot) peut être détecter plusieurs fois par l'intermédiaire de plusieurs mots différents (#match, #equipe1, #equipe2, #Equipe1vsEquipe2, …). Dans la version actuelle de Gazouille, une diversité (ne pas retourner des événements similaires) des résultats est assurée à l'aide d'un algorithme de détection de communauté.

Travail demandé

L'objectif de ce projet de recherche est dans un premier temps d'améliorer l'étape de diversification des événements détectés par Gazouille. Ensuite, de nouvelles méthodes pour caractériser un événement pourront être définie (périodicité, potentiel de diffusion, etc.)

Dans ce contexte, le travail demandé est le suivant :

  • Etude de l'état de l'art sur la détection d'événements et la détection de communauté.
  • Amélioration de la diversification.
  • Caractérisation d'un événement (périodicité, etc.)

Bibliographie

  • Pierre Houdyer, Albrecht Zimmermann, Mehdi Kaytoue, Marc Plantevit, Joseph Mitchell, Céline Robardet: Gazouille: Detecting and Illustrating Local Events from Geolocalized Social Media Streams. ECML/PKDD 2015: 276-280

Informations complémentaires

Ce projet est pertinent pour les étudiants désirant s'orienter vers des thématiques Big Data, Data Mining, Data Science.

prim1516gazouille_comm.txt · Last modified: 2015/10/29 06:38 by mplantev

CNRS INSA de Lyon Université Lyon 1 Université Lyon 2 École centrale de Lyon