Projet transversal TWEAK, SMA, SAARA 2014-2016

Apprentissage développemental :

théorie et applications

Amélie Cordier - 05 juillet 2016 - http://liris.cnrs.fr/devlearn

LIRIS

Équipes et personnes impliquées

  • Amélie Cordier (TWEAK, SMA)
  • Olivier Georgeon (TWEAK)
  • Florian Bernard (TWEAK, stage)
  • Rémi Casado (TWEAK, SMA, stage)
  • Salima Hassas (SMA)
  • Laëtitia Matignon (SMA)
  • Erwan Guillou (SAARA)

Objectifs du projet et moyens d'évaluation

Fédérer les travaux sur l'apprentissage développemental au sein du pôle Cognition et Interaction

Étudier la théorie et les applications de l'apprentissage développemental

Contexte scientifique

Apports de TWEAK

Apports de SMA

  • Approches constructivistes de la cognition [Carvalho2008]
  • Apprentissage développemental pour l'intelligence ambiante [Mazac2015]

Apports de SAARA

  • Cas d'utilisation
  • Plateforme matérielle, grâce au département informatique de la FST Lyon 1 (merci !)
ideal FST Lyon 1

Réalisations

  • Qu'est-ce que l'apprentissage développemental ?
  • Apprentissage développemental vs. apprentissage par renforcement
  • Premiers pas vers la création de noumènes

Qu'est-ce que l'apprentissage développemental ?

Qu'est-ce que l'apprentissage développemental ?

L'apprentissage développemental trouve ses origines dans les travaux de Piaget [Piaget1937].

“ Apprendre, sans connaissance de l'environnement, à partir de régularités spatio-temporelles et au travers des interactions. ”

On parle d'approche constructiviste et émergente de la cognition.

Le "small loop problem"

Vers l'auto-programmation ?

Apprentissage développemental vs. apprentissage par renforcement

Apprentissage développemental vs. apprentissage par renforcement

Problème : réaliser une étude comparative de l'apprentissage développemental et de l'apprentissage par renforcement dans des situations distinctes et délimités

Démarche :

  • Identification de problèmes (X*Y*, Small loop problem)
  • Implémentation de prototypes en s'inspirant de l'apprentissage par renforcement (TOA)
  • Analyse des résultats par l'observation de l'émergence de comportements cognitifs, ainsi que par des mesures

Apprentissage développemental vs. apprentissage par renforcement

Résultats :

  • Analyse comparative des avantages et inconvénients des approches en fonction de la nature des problèmes
  • Éléments de comparaision et de sélection des deux approches
Small loop problem
Trace avec récompenses

Premiers pas vers la création de noumènes

Vers un monde nouménal

The string problem

Un outil pour la simulation

Outil pour la simulation

Actions d'animation, effets de levier

Séminaire de pôle

16 décembre 2014

http://liris.cnrs.fr/ideal/workshop2014

Programme

  • Pierre De Loor. Les liens entre paradigmes incarnés de la cognition et intelligence artificielle : quelques exemples
  • Alain Dutech. Expériences préliminaires en Apprentissage par Renforcement Développemental
  • Stéphane Doncieux. De la robotique évolutionniste à la robotique développementale
Pierre de Loor Alain Dutech Stéphane Doncieux

Little AI

Un outil pour mieux comprendre les difficultés de l'apprentissage développemental.
“ Plus jamais je ne me moquerai des robots qui essaient d'apprendre et qui se cognent bêtement ! ”

Augustin C., étudiant en M2IA et testeur de Little AI.

Little AI

Little AI

Little AI et Thymio

Pour la pédagogie...

thymio

Publications

Publications issues du projet

Modeling Biological Agents Beyond the Reinforcement-Learning Paradigm. O. Georgeon, R. Casado, L. Matignon. BICA 2015.

Constructing Phenomenal Knowledge in an Unknown Noumenal Reality. O. Georgeon, F. Bernard, A. Cordier. BICA 2015.

Références

[Piaget1937] The Construction of Reality in the Child. J. Piaget. New York. Basic classics in psychology. Basic Books. 1937.

[Carvalho2008] Représentations émergentes — Une Approche Multi-Agents des Systèmes Complexes Adaptatifs en Psychologie Cognitive. L. Lana de Carvalho. Thèse de l'Université Lyon 2. 2008.

[Georgeon2010] An Algorithm for Self-Motivated Hierarchical Sequence Learning. O. Georgeon, J. Morgan, F. Ritter. International Conference on Cognitive Modeling, Philadelphia, PA. pp. 73-78. 2010.

[Mazac2015] Approche décentralisée de l'apprentissage constructiviste et modélisation multi-agent du problème d'amorçage de l'apprentissage sensorimoteur en environnement continu : application à l'intelligence ambiante. S. Mazac. Thèse de l'Université Lyon 1. 2015.

...

Pour aller plus loin

Designing Environment-Agnostic Agents.. O. Georgeon, I. Sakellariou. Pages 25–32 of Enda Howley, Peter Vrancx, & Knudson, Matt (eds), ALA2012, Adaptive Learning Agents workshop, at AAMAS2012, 11th International Conference on Autonomous Agents and Multiagent Systems.

The Radical Interactionism Conceptual Commitment. O. Georgeon, D. Aha. 2013. Journal of Artificial General Intelligence, 4(2), 31–36.

Inverting the Interaction Cycle to Model Embodied Agents. O. Georgeon, A. Cordier. 2014. Procedia Computer Science, 41, 243–248.

Single agents can be constructivist too. O. Georgeon, S. Hassas. 2014. Constructivist Foundations, 9(1), 40–42.

Mécanismes d'apprentissage développemental et intrinsèquement motivés en intelligence artificielle : étude des mécanismes d'intégration de l'espace environnemental. Simon Gay. 2014. Thèse de doctorat de l'Université Claude Bernard Lyon 1.

Merci...

... et venez jouer avec Little AI !

little AI

http://little-ai.com/