Chargement...
 

Historique: CedricReunion12juin2007nicolas

Aperçu de cette version: 2

...

4 taches
  • première tache : seek / homing
    • trouver la balle rouge et s'en approcher. environnement avec quelques objets distracteurs: jaune vert bleu. arene blanche
    • avancement: relancé tous les runs avec les nouvelles perceptions
  • quatrième tache : slalom
    • slalom: si rouge on va a gauche, bleu sur la droite.
    • critique: tache 3 et 4 identique : il s'agit d'un slalom entre plots rouge et bleu. indépendemment de la méthode.
    • avancement: toutes les demos ont été refaite, presque toutes les méthodes ont été lancées dessus

protocole d'expérimentation: (inchangé depuis la semaine derniere)
  • erreur quadratique entre controle donné et controle prédit
  • 1 démonstration: depuis le point de départ jusqu'a l'arret (soit parce que cible atteinte soit parce que timeout)
  • 1 démonstration : 200 à 400 ( exemples = pas de temps )
  • 1 expérience: 10 démonstrations
  • 10 runs, validation: 20% pour test et on ressample entre chaque runs.

controleur, mise a jour de la semaine derniere:
  • rdn(0), 8 senseurs IR + abcisse du point rouge ( + abcisse point bleu si slalom)
    • expe refait avec les nouvelles démos
    • tache 1: 43% appr, 42% test, variance enorme
    • tache 2: 17% appr, 18% test

controleur, plusieurs perceptions simplifiées:
  • rdn( 56 à 700 , 0 , 2 )
    • tache 1: homing (toutes les expes sont faites 10 fois)
      • 8 IR + teinte, 18x13 : 26% appr, 35% test TODO: ajouter courbe lien
      • 8 IR + teinte, 8x6 : 31% appr, 33% test
      • 8 IR + teinte+lumi, 18x13 : 25% appr, 33% test
      • 8 IR + teinte+lumi, 1 sur 2 sur du 18x13 : on oublie parce que pas rigoureux
      • 8 IR + teinte+lumi, 8x6 : 28% appr, 31% test
      • 8 IR + RGB, 18x13 : 30% appr, 35% test
      • 8 IR + RGB, 8x6 : 28% appr, 31% test
      • remarque: différence marginale, teinte+lumi et RGB en 8x6 se degage un peu (erreur: 28%,31%).
    • tache 2: slalom
      • 8 IR, teinte, 18x13 : 9%, 17%
      • 8 IR, teinte + lumi, 18x13 : 11%, 16%
      • 8 IR, teinte + lumi, 8x6 : 10%, 15%
      • 8 IR, RGB 18x13 : 30%, 31%
      • 8 IR, RGB 8x6 : 11%, 13% TODO : verifie que c'est ca


  • Questions
    • protocole d'apprentissage: défaut du a la grande redondance de cas facile.
      • soit on resample pour favoriser l'hétérogénéité de la base d'apprentissage
      • soit on utilise une base de test séparée plutot que des bouts --> important quand on passera à des ctl recurrents (ou le flux temporel est crucial)


  • rdn(0) simple. 8 senseurs IR + toute l'image 2D en entrée 18x13 mais cahque valeur double contient alpharvb
    • probleme: entrée alpha+RVB sur un réel n'a pas de sens: majoritairement l'activation de R est prise en compte
    • tache 1 : néanmoins, de "bon" résultat. 20 a 30% d'erreur (22 sur la base d'apprentissage, 30 sur la base de test)
    • tache 2 : 3% apprentissage, 6% validation
  • rdn(10) avec couche cachée (10 neurones). idem pour les entrées
    • 15% sur apprentissage, 21% sur test
  • rdn(0) avec couche cachée. 8 senseurs IR + abcisse du point rouge
    • tache 1 : 43% sur apprentissage, 42% sur test , variance enorme (17-18%)
    • tache 2 : 12% apprentissage, 14% validation
    • nouvelle tache 2 : 17.7% apprentissage, 17.7%
  • rdn(6r) recurrent, ?6? TODO neurones cachés. 8 IR + abcisse
    • cmaes restart (parametre: pas d'amélioration depuis 10 generations) TODO: courbe
    • tache 1 : 30% apprentissage, TODO pas tester sur base test
    • PROBLEME: pas de validation sur plusieurs runs
  • MPL, 18x13
    • tache 1 : 45% sur apprentissage, 55% sur test (pourri)
    • probleme: (1) beaucoup trop de données pour MPL et (2) MPL surtout tres bon en envt bruité.
    • critique tous les points, ce n'est pas bon, les resultats connus sur MPL disent 2 à 3 pas plus. TODO refaire avec juste 2 et 3. remarque: il est pas forcé que 3 soit mieux ici, vu que l'envt est tres homogene.

questions diverses
  • critique fondée :
    • calcul de l'erreur sur la base n'est pas représentatif de la tache parce que le peu d'exemples que l'on a n'est pas suffisant pour capturer la distrib de l'envt.
    • a moyen terme: completer avec un test de reproductibilité en réel
      • à définir: 20 démonstrations a partir de point différents + évaluation empirique.
  • TODO : espace en entrée:
    • [X] RVB séparé (probleme: multiplie par trois les entrées)
      • [X] expe 1
      • [X]expe 2
    • [X] RVB séparé avec degradation resolution pour avoir le meme nombre d'entrée qu'avant
      • [X] expe 1
      • [X] expe 2
    • [X] Teinte seule sur 18x13
      • [X] expe 1 :
      • [X] expe 2 :
    • [X] Teinte et Luminosité (HL)seule sur 18x13 todo
      • [X] expe 1 :
      • [X] expe 2 :
    • [X]Teinte et Luminosité (HL) seule sur resolution pour correspondre avec 18*13 entrées
      • [X] expe 1
      • [X] expe 2
    • [X] HL sur 8x6 todo
      • [X] teinte sur 8x6 (expe 1)
      • [X] teinte+luminosité (expe 1)
      • [X] rgb (3*48) (expe 1)
    • HL sur 24x16 plus tard
    • a faire sur rdn(10)
  • TODO
    • [x] echo state network: soit recup code alex, soit tu recodes.
      • [X] reseau codé
      • [ ] algorithme d'apprentissage non fonctionnel encore (au pire, greffon de piconode comme reseau de sortie et application de la backprop integrée.

  • sur les taches:
    • (1) aller vers cible et (2) slaloms
  • perspectives: reprendre oudeyer+kaplan pour la simplification de l'espace sensorielle

prochaine reunion: mardi 12 juin 17h : (0) mettre a jour les todos (1) espace d'entrée (2) ESN (3) tache slalom

Historique

Avancé
Information Version
mer. 13 de Jun, 2007 10h45 cedric from 129.175.5.147 8
Afficher
mar. 12 de Jun, 2007 18h17 nicolas from 129.175.5.159 7
Afficher
mar. 12 de Jun, 2007 18h14 nicolas from 129.175.5.159 6
Afficher
mar. 12 de Jun, 2007 17h51 nicolas from 129.175.5.159 5
Afficher
mar. 12 de Jun, 2007 17h45 nicolas from 129.175.5.159 4
Afficher
mar. 12 de Jun, 2007 17h40 nicolas from 129.175.5.159 3
Afficher
mar. 12 de Jun, 2007 17h37 nicolas from 129.175.5.159 2
Afficher
mar. 12 de Jun, 2007 17h08 nicolas from 129.175.5.159 1
Afficher