IGFF NET 4529
M1
Graduate
Fall
Programme Ingénieur
Français/French
4
45
Charge enseignement / Total : 45/90
A la fin de ce module les étudiants seront capables de :
- bien comprendre les types de réseaux de neurones
- bien comprendre quel type utiliser pour résoudre un problème
- avoir une bonne expérience à manipuler du 'big data' par Pandas (python)
- acquérir les connaissances de base de l'apprentissage par renforcement
- maitriser les environnements GYM et OPENAI dans TENSORFLOW
- adapter un problème pratique à un agent discret ou continu.
Python, bases de réseaux
- Introduction aux techniques d’apprentissage (général)
- Panorama des méthodes (général)
- Apprentissage supervisé SVM (appliqué aux réseaux)
- Apprentissage par renforcement
- Markov Decision Process 1
- MDP 2
- TP SVM
- TP MDP
- TP Renforcement 1
- TP Renforcement 2
- Projet de renforcement
- présence notée, TP noté, projet, controle (25%,50%,15%, 10%)
Mots clé :
Renforcement, apprentissage, techniques de gradient, MDP, politiques d’approximation
Learning materials :
Literature :
- "Hands on Machine Learning”
- Deep reinforcement Learning
- tous les exemples de renforcement sur github
- les MDP dans l'IA
Apprentissage par la pratique, apprentissage sur des exemples réels, usage des outils les plus appropriés à une maitrise rapide