Chargement...
 

Historique: CedricReunion5juin2007nicolas

Aperçu de cette version: 5

...

4 taches
  • première tache fait
    • trouver la balle rouge et s'en approcher. environnement avec quelques objets distracteurs: jaune vert bleu. arene blanche
  • seconde tache
    • s'orienter vers la balle rouge
  • troisième tache
    • orientation: quand on voit du bleu, on tourne sur la droite, sinon on tourne sur la gauche
  • quatrième tache fait
    • slalom: si rouge on va a gauche, bleu sur la droite.
    • critique: tache 3 et 4 identique : il s'agit d'un slalom entre plots rouge et bleu. indépendemment de la méthode.

protocole d'expérimentation:
  • erreur quadratique entre controle donné et controle prédit
  • 1 démonstration: depuis le point de départ jusqu'a l'arret (soit parce que cible atteinte soit parce que timeout)
  • 1 démonstration : 200 à 400 ( exemples = pas de temps )
  • 1 expérience: 10 démonstrations
  • 10 runs, validation: 20% pour test et on ressample entre chaque runs.

controleur:
  • rdn simple. 8 senseurs IR + toute l'image 2D en entrée 18x13 mais cahque valeur double contient alpharvb
    • probleme: entrée alpha+RVB sur un réel n'a pas de sens: majoritairement l'activation de R est prise en compte
    • néanmoins, de "bon" résultat. 20 a 30% d'erreur (22 sur la base d'apprentissage, 30 sur la base de test)
  • rdn avec couche cachée (10 neurones). idem pour les entrées
    • 15% sur apprentissage, 21% sur test
  • rdn avec couche cachée. 8 senseurs IR + abcisse du point rouge
    • 43% sur apprentissage, ?? sur test erreur TODO , variance enorme
  • rdn recurrent, ?6? TODO neurones cachés. 8 IR + abcisse
    • cmaes restart (parametre: pas d'amélioration depuis 10 generations) TODO: courbe
    • 30% apprentissage, TODO pas tester sur base test
    • PROBLEME: pas de validation sur plusieurs runs
  • MPL
    • 45% sur apprentissage, 55% sur test (pourri)
    • probleme: beaucoup trop de données

questions diverses
  • critique fondée :
    • calcul de l'erreur sur la base n'est pas représentatif de la tache parce que le peu d'exemples que l'on a n'est pas suffisant pour capturer la distrib de l'envt.
    • a moyen terme: completer avec un test de reproductibilité en réel
      • à définir: 20 démonstrations a partir de point différents + évaluation empirique.



Historique

Avancé
Information Version
mar. 05 de Jun, 2007 17h45 nicolas from 129.175.5.159 8
Afficher
mar. 05 de Jun, 2007 17h39 nicolas from 129.175.5.159 7
Afficher
mar. 05 de Jun, 2007 17h37 nicolas from 129.175.5.159 6
Afficher
mar. 05 de Jun, 2007 17h36 nicolas from 129.175.5.159 5
Afficher
mar. 05 de Jun, 2007 17h30 nicolas from 129.175.5.159 4
Afficher
mar. 05 de Jun, 2007 17h25 nicolas from 129.175.5.159 3
Afficher
mar. 05 de Jun, 2007 17h23 nicolas from 129.175.5.159 2
Afficher
mar. 05 de Jun, 2007 17h07 nicolas from 129.175.5.159 1
Afficher