Apprentissage statistique

Catalogue des cours de Télécom SudParis

Code

IGSF MAT 4506

Niveau

M1

Graduate

Graduate

Semestre

Spring

Domaine

Mathématiques

Programme

Programme grande école

Langue

Français/French

Crédits ECTS

4

Heures programmées

45

Charge de travail

90

Acquis d'apprentissage

A la fin de ce module les étudiants devront savoir :
- Se familiariser avec les outils de la fouille de donnée
- Se familiariser avec le logiciel R
- Savoir effectuer classification supervisée en R
- Savoir effectuer une régression en R
- Utiliser ces outils sur des données réelles
- Comprendre la notion de surapprentissage

Contenu

Les méthodes d'apprentissage statistique permettent de prendre automatiquement des décisions à partir d'exemples. Ces méthodes s'appliquent dans des situations très variées qui vont de la génomique au marketing. Dans ce cours on étudiera deux problèmes voisins : la classification et la régression. On illustrera ces méthodes à l'aide du logiciel R sur des données réelles.
- Introduction : classification et régression
- Outils fondamentaux
- Classification supervisée
- Régression

Prérequis

Algorithmique et programmation (CSC 3002), Analyse de données (MAT 3502)

Mots-clés

Fouille de données ("Data Mining"), Apprentissage statistique ("Statistical/Machine Learning")

Formule de l'évaluation

Note de participation (NP)
Note de TP (TP)
Note de contrôle continu CC = (NP+TP)/2
Examen écrit EC
Note finale NF = max ( (CC+EC)/2, EC)

Compétences CDIO

Compétences principales

  • 1.1.1 - Mathématiques (y compris statistiques)
  • 1.2 - Connaissance des principes fondamentaux d'ingénierie
  • 1.3 - Connaissances avancées en ingénierie : méthodes et outils
  • 2.1.1 - Apprendre à poser et formuler les problèmes
  • 2.1.2 - Modélisation
  • 2.1.3 - Analyse qualitative
  • 4.7 - Mener des projets d'ingénierie innovants
Fiche mise à jour le 24/07/2018