Transparents
Projet
Ces projets peuvent être réalisés seul ou en binôme, et feront l'objet
- d'un rendu composé d'un rapport de synthèse et des fichiers produits,
- d'une présentation orale le vendredi 2 mars.
Constitution d'une ontologie
Après avoir choisi un domaine qui vous intéresse, vous en ferez une ontologie sous Protégé. À cette fin, vous constituez un corpus de documents textuels (pages web ou autre) portant sur ce domaine, et vous utiliserez un outil de Traitement Automatique des Langues pour en extraire des candidats termes, qui serviront de base de départ pour les concepts et les rôles de votre ontologie.
Outils possibles :
Pensez aussi à relier votre ontologie aux ontologies existantes connexes.
Annotation sémantique
Dans votre corpus de documents textuels, choisissez deux pages web dont vous ferez une copie locale que vous annoterez en RDFa en utilisant les termes de votre ontologie.
Par ailleurs, trouvez une ou deux vidéos (selon leur durée) portant également sur ce domaine, et annotez les avec Advene selon un schéma inspiré de votre ontologie. Vous utiliserez ensuite ces annotations pour générer des documents HTML contenant du RDFa décrivant sémantiquement des fragments de la vidéo.
Recherche d'information sémantique
Extrayez les données RDF des différents documents HTML+RDFa que vous avez constitués. Importez les dans Protégé avec votre ontologie, et utilisez le moteur d'inférence pour faire des requêtes non triviales sur ces données. Dans votre rapport et votre présentation, vous donnerez des exemples de telles requêtes et les résultats fournis par Protégé.