Chargement...
 

Historique: CedricReunion5juin2007nicolas

Aperçu de cette version: 24

...

4 taches
  • première tache fait
    • trouver la balle rouge et s'en approcher. environnement avec quelques objets distracteurs: jaune vert bleu. arene blanche
  • seconde tache
    • s'orienter vers la balle rouge
  • troisième tache
    • orientation: quand on voit du bleu, on tourne sur la droite, sinon on tourne sur la gauche
  • quatrième tache fait
    • slalom: si rouge on va a gauche, bleu sur la droite.
    • critique: tache 3 et 4 identique : il s'agit d'un slalom entre plots rouge et bleu. indépendemment de la méthode.

protocole d'expérimentation:
  • erreur quadratique entre controle donné et controle prédit
  • 1 démonstration: depuis le point de départ jusqu'a l'arret (soit parce que cible atteinte soit parce que timeout)
  • 1 démonstration : 200 à 400 ( exemples = pas de temps )
  • 1 expérience: 10 démonstrations
  • 10 runs, validation: 20% pour test et on ressample entre chaque runs.

controleur:
  • rdn(0) simple. 8 senseurs IR + toute l'image 2D en entrée 18x13 mais cahque valeur double contient alpharvb
    • probleme: entrée alpha+RVB sur un réel n'a pas de sens: majoritairement l'activation de R est prise en compte
    • tache 1 : néanmoins, de "bon" résultat. 20 a 30% d'erreur (22 sur la base d'apprentissage, 30 sur la base de test)
    • tache 2 : 3% apprentissage, 6% validation
  • rdn(10) avec couche cachée (10 neurones). idem pour les entrées
    • 15% sur apprentissage, 21% sur test
  • rdn(10) avec couche cachée. 8 senseurs IR + abcisse du point rouge
    • tache 1 : 43% sur apprentissage, 42% sur test , variance enorme (17-18%)
    • tache 2 : 12% apprentissage, 14% validation
    • nouvelle tache 2 : 17.7% apprentissage, 17.7%
  • rdn(6r) recurrent, ?6? TODO neurones cachés. 8 IR + abcisse
    • cmaes restart (parametre: pas d'amélioration depuis 10 generations) TODO: courbe
    • tache 1 : 30% apprentissage, TODO pas tester sur base test
    • PROBLEME: pas de validation sur plusieurs runs
  • MPL, 18x13
    • tache 1 : 45% sur apprentissage, 55% sur test (pourri)
    • probleme: (1) beaucoup trop de données pour MPL et (2) MPL surtout tres bon en envt bruité.
    • critique tous les points, ce n'est pas bon, les resultats connus sur MPL disent 2 à 3 pas plus. TODO refaire avec juste 2 et 3. remarque: il est pas forcé que 3 soit mieux ici, vu que l'envt est tres homogene.

questions diverses
  • critique fondée :
    • calcul de l'erreur sur la base n'est pas représentatif de la tache parce que le peu d'exemples que l'on a n'est pas suffisant pour capturer la distrib de l'envt.
    • a moyen terme: completer avec un test de reproductibilité en réel
      • à définir: 20 démonstrations a partir de point différents + évaluation empirique.
  • TODO : espace en entrée:
    • [X] RVB séparé (probleme: multiplie par trois les entrées)
      • [X] expe 1
      • [X]expe 2
    • [X] RVB séparé avec degradation resolution pour avoir le meme nombre d'entrée qu'avant
      • [X] expe 1
      • [X] expe 2
    • [X] Teinte seule sur 18x13
      • [X] expe 1 :
      • [X] expe 2 :
    • [X] Teinte et Luminosité (HL)seule sur 18x13 todo
      • [X] expe 1 :
      • [X] expe 2 :
    • [X]Teinte et Luminosité (HL) seule sur resolution pour correspondre avec 18*13 entrées
      • [X] expe 1
      • [X] expe 2
    • [X] HL sur 8x6 todo
      • [X] teinte sur 8x6 (expe 1)
      • [X] teinte+luminosité (expe 1)
      • [X] rgb (3*48) (expe 1)
    • HL sur 24x16 plus tard
    • a faire sur rdn(10)
  • TODO
    • echo state network: soit recup code alex, soit tu recodes.
  • sur les taches:
    • (1) aller vers cible et (2) slaloms
  • perspectives: reprendre oudeyer+kaplan pour la simplification de l'espace sensorielle

prochaine reunion: mardi 12 juin 17h : (0) mettre a jour les todos (1) espace d'entrée (2) ESN (3) tache slalom

Historique

Avancé
Information Version
mar. 12 de Jun, 2007 17h13 nicolas from 129.175.5.159 28
Afficher
mar. 12 de Jun, 2007 17h01 cedric from 129.175.5.147 27
Afficher
mar. 12 de Jun, 2007 14h03 cedric from 129.175.5.147 26
Afficher
mar. 12 de Jun, 2007 14h01 cedric from 129.175.5.147 25
Afficher
mar. 12 de Jun, 2007 13h58 cedric from 129.175.5.147 24
Afficher
mar. 12 de Jun, 2007 13h50 cedric from 129.175.5.147 23
Afficher
mar. 12 de Jun, 2007 13h48 cedric from 129.175.5.147 22
Afficher
mar. 12 de Jun, 2007 11h29 cedric from 129.175.5.147 21
Afficher
mar. 12 de Jun, 2007 11h08 cedric from 129.175.5.147 20
Afficher
mar. 12 de Jun, 2007 10h52 cedric from 129.175.5.147 19
Afficher