Livres


Vidéos



19 novembre


26 novembre

  • Multi-Armed Bandits & Applications

3 décembre

* TP (3h, Herilalaina Rakotoarison).

10 décembre

  • TP, Herilalaina Rakotoarison

7 janvier

  • Cours + TP, Function Approximation

14 janvier

  • Cours + TP, Direct Policy Search

Exposés (28 janvier et 4 février)

Par binome, choisissez un article ds la liste ci-dessous (premier arrivé premier servi), et présentez le (avec transparents ou au tableau) pour un exposé de 10 minutes + 5 mn questions : réimplémentation de l'algo si réaliste ; étude de sensibilité, analyse des résultats si code disponible. Le but de l'exposé est de rendre clair l'utilité et les limites de l'approche, et votre capacité de jugement (qualité de la validation, de l'argumentation, poussière sous le tapis, fertilité scientifique, etc).

28 janvier



4 février, ordre de passage.


  1. Human-level control through deep reinforcement learning
    1. Bouaziz, Dittrick
  2. Deep Reinforcement Learning with Double Q-learning
    1. Mirwaisse Djanbaz, Luc Gibaud, Théo Cornille
  3. Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
    1. Jabri, Hamidèche (discutants: Duraz et Gao).
  4. The Predictron: End-To-End Learning and Planning
    1. Malik Kazi Aoual et Nouredine Nour
  1. Gated Path Planning Networks
    1. Adrien Chuttarsing Vu Thanh Trung
  1. Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings
    1. Maktouf et Garcia Cancian
  2. Latent Space Policies for Hierarchical Reinforcement Learning
    1. BIARD David BERRIEN Samuel
  1. Learning the Reward Function for a Misspecified Model
    1. Luca Veyrin-forrer
  1. End-to-end Active Object Tracking via Reinforcement Learning
    1. Joslove, Riolacci
  2. A Deep Reinforcement Learning Chatbot
    1. Yakoubi et Mascaro



Deep RL

Robustesse


Optimisation

Monte-Carlo Tree Search

Applications