Projet transversal TWEAK, SMA, SAARA 2014-2016

Apprentissage développemental :

théorie et applications

Amélie Cordier - 05 juillet 2016 - http://liris.cnrs.fr/devlearn

Équipes et personnes impliquées

Amélie Cordier (TWEAK, SMA)
Olivier Georgeon (TWEAK)
Florian Bernard (TWEAK, stage)
Rémi Casado (TWEAK, SMA, stage)
Salima Hassas (SMA)
Laëtitia Matignon (SMA)
Erwan Guillou (SAARA)

Objectifs du projet et moyens d'évaluation

Fédérer les travaux sur l'apprentissage développemental au sein du pôle Cognition et Interaction

Groupe de travail, compte-projet
Action de pôle en décembre 2014
Collaborations académiques et industrielles engagées

Étudier la théorie et les applications de l'apprentissage développemental

Réalisation de plusieurs démonstrateurs en monde virtuel
Réalisation d'un démonstrateur en monde physique, avec application pédagogique
Implémentation d'un jeu pour illustrer les problèmes
Publication de deux articles

Contexte scientifique

Apports de TWEAK

Traces d'interactions comme socle d'apprentissage de régularités spatio-temporelles [Georgeon2010]
ANR RPDOC "IDEAL" - Implementation of Developmental Learning (https://liris.cnrs.fr/ideal)

Apports de SMA

Approches constructivistes de la cognition [Carvalho2008]
Apprentissage développemental pour l'intelligence ambiante [Mazac2015]

Apports de SAARA

Cas d'utilisation
Plateforme matérielle, grâce au département informatique de la FST Lyon 1 (merci !)

Réalisations

Qu'est-ce que l'apprentissage développemental ?
Apprentissage développemental vs. apprentissage par renforcement
Premiers pas vers la création de noumènes

Qu'est-ce que l'apprentissage développemental ?

L'apprentissage développemental trouve ses origines dans les travaux de Piaget [Piaget1937].

“ Apprendre, sans connaissance de l'environnement, à partir de régularités spatio-temporelles et au travers des interactions. ”

On parle d'approche constructiviste et émergente de la cognition.

Le "small loop problem"

Vers l'auto-programmation ?

Apprentissage développemental vs. apprentissage par renforcement

Problème : réaliser une étude comparative de l'apprentissage développemental et de l'apprentissage par renforcement dans des situations distinctes et délimités

Démarche :

Identification de problèmes (X*Y*, Small loop problem)
Implémentation de prototypes en s'inspirant de l'apprentissage par renforcement (TOA)
Analyse des résultats par l'observation de l'émergence de comportements cognitifs, ainsi que par des mesures

Apprentissage développemental vs. apprentissage par renforcement

Résultats :

Analyse comparative des avantages et inconvénients des approches en fonction de la nature des problèmes
Éléments de comparaision et de sélection des deux approches

Premiers pas vers la création de noumènes

Vers un monde nouménal

Un outil pour la simulation

Actions d'animation, effets de levier

Collaboration industrielle en développement
Séminaire de pôle
Little AI

Séminaire de pôle

16 décembre 2014

http://liris.cnrs.fr/ideal/workshop2014

Programme

Pierre De Loor. Les liens entre paradigmes incarnés de la cognition et intelligence artificielle : quelques exemples
Alain Dutech. Expériences préliminaires en Apprentissage par Renforcement Développemental
Stéphane Doncieux. De la robotique évolutionniste à la robotique développementale

Little AI

Un outil pour mieux comprendre les difficultés de l'apprentissage développemental.

“ Plus jamais je ne me moquerai des robots qui essaient d'apprendre et qui se cognent bêtement ! ”

Augustin C., étudiant en M2IA et testeur de Little AI.

Little AI

Little AI et Thymio

Pour la pédagogie...

Publications

Publications issues du projet

Modeling Biological Agents Beyond the Reinforcement-Learning Paradigm. O. Georgeon, R. Casado, L. Matignon. BICA 2015.

Constructing Phenomenal Knowledge in an Unknown Noumenal Reality. O. Georgeon, F. Bernard, A. Cordier. BICA 2015.

Références

[Piaget1937] The Construction of Reality in the Child. J. Piaget. New York. Basic classics in psychology. Basic Books. 1937.

[Carvalho2008] Représentations émergentes — Une Approche Multi-Agents des Systèmes Complexes Adaptatifs en Psychologie Cognitive. L. Lana de Carvalho. Thèse de l'Université Lyon 2. 2008.

[Georgeon2010] An Algorithm for Self-Motivated Hierarchical Sequence Learning. O. Georgeon, J. Morgan, F. Ritter. International Conference on Cognitive Modeling, Philadelphia, PA. pp. 73-78. 2010.

[Mazac2015] Approche décentralisée de l'apprentissage constructiviste et modélisation multi-agent du problème d'amorçage de l'apprentissage sensorimoteur en environnement continu : application à l'intelligence ambiante. S. Mazac. Thèse de l'Université Lyon 1. 2015.

...

Pour aller plus loin

Designing Environment-Agnostic Agents.. O. Georgeon, I. Sakellariou. Pages 25–32 of Enda Howley, Peter Vrancx, & Knudson, Matt (eds), ALA2012, Adaptive Learning Agents workshop, at AAMAS2012, 11th International Conference on Autonomous Agents and Multiagent Systems.

The Radical Interactionism Conceptual Commitment. O. Georgeon, D. Aha. 2013. Journal of Artificial General Intelligence, 4(2), 31–36.

Inverting the Interaction Cycle to Model Embodied Agents. O. Georgeon, A. Cordier. 2014. Procedia Computer Science, 41, 243–248.

Single agents can be constructivist too. O. Georgeon, S. Hassas. 2014. Constructivist Foundations, 9(1), 40–42.

Mécanismes d'apprentissage développemental et intrinsèquement motivés en intelligence artificielle : étude des mécanismes d'intégration de l'espace environnemental. Simon Gay. 2014. Thèse de doctorat de l'Université Claude Bernard Lyon 1.

Merci...

... et venez jouer avec Little AI !

http://little-ai.com/