TikiWiki | CedricReunion5juin2007nicolas

...

4 taches

première tache fait
- trouver la balle rouge et s'en approcher. environnement avec quelques objets distracteurs: jaune vert bleu. arene blanche
seconde tache
- s'orienter vers la balle rouge
troisième tache
- orientation: quand on voit du bleu, on tourne sur la droite, sinon on tourne sur la gauche
quatrième tache RE - fait
- slalom: si rouge on va a gauche, bleu sur la droite.
- critique: tache 3 et 4 identique : il s'agit d'un slalom entre plots rouge et bleu. indépendemment de la méthode.

protocole d'expérimentation:

erreur quadratique entre controle donné et controle prédit
1 démonstration: depuis le point de départ jusqu'a l'arret (soit parce que cible atteinte soit parce que timeout)
1 démonstration : 200 à 400 ( exemples = pas de temps )
1 expérience: 10 démonstrations
10 runs, validation: 20% pour test et on ressample entre chaque runs.

controleur:

rdn(0) simple. 8 senseurs IR + toute l'image 2D en entrée 18x13 mais cahque valeur double contient alpharvb
- probleme: entrée alpha+RVB sur un réel n'a pas de sens: majoritairement l'activation de R est prise en compte
- tache 1 : néanmoins, de "bon" résultat. 20 a 30% d'erreur (22 sur la base d'apprentissage, 30 sur la base de test)
- tache 2 : 3% apprentissage, 6% validation
rdn(10) avec couche cachée (10 neurones). idem pour les entrées
- 15% sur apprentissage, 21% sur test
rdn(0) avec couche cachée. 8 senseurs IR + abcisse du point rouge
- tache 1 : 43% sur apprentissage, 42% sur test , variance enorme (17-18%)
- tache 2 : 12% apprentissage, 14% validation
- nouvelle tache 2 : 17.7% apprentissage, 17.7%
rdn(6r) recurrent, ?6? TODO neurones cachés. 8 IR + abcisse
- cmaes restart (parametre: pas d'amélioration depuis 10 generations) TODO: courbe
- tache 1 : 30% apprentissage, TODO pas tester sur base test
- PROBLEME: pas de validation sur plusieurs runs
MPL, 18x13
- tache 1 : 45% sur apprentissage, 55% sur test (pourri)
- probleme: (1) beaucoup trop de données pour MPL et (2) MPL surtout tres bon en envt bruité.
- critique tous les points, ce n'est pas bon, les resultats connus sur MPL disent 2 à 3 pas plus. TODO refaire avec juste 2 et 3. remarque: il est pas forcé que 3 soit mieux ici, vu que l'envt est tres homogene.

questions diverses

critique fondée :
- calcul de l'erreur sur la base n'est pas représentatif de la tache parce que le peu d'exemples que l'on a n'est pas suffisant pour capturer la distrib de l'envt.
- a moyen terme: completer avec un test de reproductibilité en réel
  - à définir: 20 démonstrations a partir de point différents + évaluation empirique.
TODO : espace en entrée:
- [X] RVB séparé (probleme: multiplie par trois les entrées)
  - [X] expe 1
  - [X]expe 2
- [X] RVB séparé avec degradation resolution pour avoir le meme nombre d'entrée qu'avant
  - [X] expe 1
  - [X] expe 2
- [X] Teinte seule sur 18x13
  - [X] expe 1 :
  - [X] expe 2 :
- [X] Teinte et Luminosité (HL)seule sur 18x13 todo
  - [X] expe 1 :
  - [X] expe 2 :
- [X]Teinte et Luminosité (HL) seule sur resolution pour correspondre avec 18*13 entrées
  - [X] expe 1
  - [X] expe 2
- [X] HL sur 8x6 todo
  - [X] teinte sur 8x6 (expe 1)
  - [X] teinte+luminosité (expe 1)
  - [X] rgb (3*48) (expe 1)
- HL sur 24x16 plus tard
- a faire sur rdn(10)
TODO
- [x] echo state network: soit recup code alex, soit tu recodes.
  - [X] reseau codé
  - [ ] algorithme d'apprentissage non fonctionnel encore (au pire, greffon de piconode comme reseau de sortie et application de la backprop integrée.

sur les taches:
- (1) aller vers cible et (2) slaloms
perspectives: reprendre oudeyer+kaplan pour la simplification de l'espace sensorielle

prochaine reunion: mardi 12 juin 17h : (0) mettre a jour les todos (1) espace d'entrée (2) ESN (3) tache slalom

CedricReunion5juin2007nicolas