...
4 taches
- première tache fait
- trouver la balle rouge et s'en approcher. environnement avec quelques objets distracteurs: jaune vert bleu. arene blanche
- seconde tache
- s'orienter vers la balle rouge
- troisième tache
- orientation: quand on voit du bleu, on tourne sur la droite, sinon on tourne sur la gauche
- quatrième tache fait
- slalom: si rouge on va a gauche, bleu sur la droite.
- critique: tache 3 et 4 identique : il s'agit d'un slalom entre plots rouge et bleu. indépendemment de la méthode.
protocole d'expérimentation:
- erreur quadratique entre controle donné et controle prédit
- 1 expérience: 10 démonstrations
- 1 tache : 10 expériences reproduites
- 10 expériences, taille de log environ de 200 et 400 exemples par expérience (1 mo)
- validation: 10 * validation avec 20% pour test
controleur:
- rdn simple avec toutes l'image 2D en entrée 18x13
- proibleme: entrée alpha+RVB sur un réel n'a pas de sens: majoritairement l'activation de R est prise en compte
- néanmoins, de "bon" résultat.