Chargement...
 

Historique: CedricReunion28juin2007nicolas

Aperçu de cette version: 6

...

Avancement:
  • bloque sur un petit bug sur les ESN : probleme quand la valeur singulière explose. donc facile au détecter (au pire)
  • TODO: mettre a jour les valeurs
  • note: on optimise le bassin d'attraction d'un système dynamique. C'est a dire a chaque point dans l'espace sensoriel, on cherche un fonction qui nous donne un deplacement dans l'espace moteur pour converger, dans l'espace sensoriel, vers un point fixe, qui se trouve le but de la démonstration. L'intuition : on compte sur la redondance des perceptions dans l'environnement pour avoir suffisament d'exemples pour fabriquer cette convergence. Evidemment ca dépend aussi de la capacité a généraliser du controleur (les rdn sont a priori un bon choix). Au final, on souhaite modéliser un controleur qui garantit le retour a l'état stable. La démo classique: point rouge au centre de la caméra, asservissement sur le point rouge. (expé à faire).

  • notes sur la validation expérimentale :
    • validation off-line (+/- déja fait) : ce qu'on évalue c'est l'erreur en classification
    • validation on-line (a faire, cf. plus bas) : ce qu'on évalue c'est le comportement du système dynamique qu'on a construit (ex. convergence vers point fixe dans le cas du tracking d'une cible rouge)

questions sur les ESN:
  • protocole de présentation des données:
    • rappel: pour apprentissage type backprop, on passe plusieurs fois une séquence.
    • rappel: dynamique interne du réservoir, entre chaque passage on fait un "washout"
    • rappel: l'ESN apprend la dynamique globale, on veut du local (ce qui nous interesse : soit des sous-partie de la démo ; soit la démo a partir d'un point d'entrée quelconque)
  • protocoles d'apprentissage (possibles), question: "quel readout ? comment l'entrainer ?"
    • readout : couche simple reservoir-outputs ; methode: reglin classique
      • avantages : super simple, biblio
      • inconvénients: pas de cycle, donc énormémement de passage, prend en compte une séquence entière, explosion du calcul ; comment on passe les N séquences??? (meme ESN toutes séquences ? cf. aussi la suite)
    • methode widrow-hoff / backprop
      • un esn, un readout perceptron, on passe les N séquences
      • ensemble control (1) : un esn + un perceptron en readout par séquence, ensuite combinaison de tous les esn
      • ensemble control (2) : un seul esn, plusieurs perceptron en readout, chaque perceptron apprend une séquence, et combinaison de tous les readout ((?PB? : aggrégation)
      • avantages: readout facile a entrainer
      • inconvénients: protocoles de présentations des séquences (ensemble control meilleures pistes?)
  • méthode de validation (ensemble)
    • contrairement aux cas précédents, la temporalité joue un role : ici on va faire :
      • une sorte de N-fold ou chaque ESN (ou readout) est validé sur une séquence non utilisée pour l'apprentissage
      • la performance de l'ensemble avec différentes options d'aggrégation sur des données non utilisées pour aucune ESN/readout
      • problème: cohérence pour comparer les résultats ESN et autres.

Expériences (sur robot) à faire:
  • asservissement point rouge. En vue : une démo ou on guide le robot avec le point rouge.

Problématiques intéressantes et prospectives:
  • (cf. michele) : néttoyage des exemples pour réduire le nombre d'exemples perturbateurs (étiquette par cohérente avec la tache)
  • etude des reservoirs dans les cas ou les ESN ne reconvergent pas aprés une perturbation (cf. exp de nicolas)
  • methode de sampling (1) : boosting...?
  • methode de sampling (2) : methode de fusion des données avant apprentissage pour construire une séquence de "méta-démonstration"

Historique

Avancé
Information Version
mar. 17 de Jul, 2007 11h45 cedric from 129.175.5.237 11
Afficher
mar. 17 de Jul, 2007 11h44 cedric from 129.175.5.237 10
Afficher
jeu. 28 de Jun, 2007 16h32 nicolas from 129.175.5.159 9
Afficher
jeu. 28 de Jun, 2007 16h31 nicolas from 129.175.5.159 8
Afficher
jeu. 28 de Jun, 2007 16h15 nicolas from 129.175.5.159 7
Afficher
jeu. 28 de Jun, 2007 16h06 nicolas from 129.175.5.159 6
Afficher
jeu. 28 de Jun, 2007 16h03 nicolas from 129.175.5.159 5
Afficher
jeu. 28 de Jun, 2007 15h57 nicolas from 129.175.5.159 4
Afficher
jeu. 28 de Jun, 2007 15h52 nicolas from 129.175.5.159 3
Afficher
jeu. 28 de Jun, 2007 15h41 nicolas from 129.175.5.159 2
Afficher