Algorithmique des flux de données

Catalogue des cours de Télécom SudParis

Code

IGSF CSC 4524

Niveau

M1

Graduate

Graduate

Semestre

Spring

Domaine

Informatique

Programme

Programme Ingénieur

Langue

Français/French

Crédits ECTS

4

Heures programmées

45

Charge de travail

90

Coordonnateur(s)

Département

  • Réseaux et Services Multimédia Mobiles

Organisation

Cours/TD/TP/projet/examen : 21/12/9/0/3

Acquis d'apprentissage

A la fin de ce module les étudiants devront
Appréhender de très grands volumes de données
Comprendre la notion de flux
Savoir utiliser les sketches
Utiliser ces outils sur des données réelles

Compétences CDIO

  • 1.3 - Advanced engineering fundamental knowledge, methods and tools
  • 4.3.3 - System Engineering - System Modeling and Interfaces
  • 4.3.4 - Development Project Management
  • 4.5.3 - Software Implementing Process
  • 4.6.4 - System Improvement and Evolution

Prérequis

Probabilités (MAT 3002) - Algorithmique et programmation (CSC 3002) - Base de données (CSC 4001)

Mots-clés

Algoithmique, flux de données ("Data Streams")

Contenu

Dans différents contextes, on peut chercher à analyser des données trop massives pour être stockées en mémoire. Dans ce cas, il faut traiter les données à la volée. On parle de traitement de flux de données. Les sructures de données et les algorithmes utilisés sont très spécifiques. C'est l'objet de ce cours que de les comprendre, les implémenter et les tester sur des données réelles.

1 - Problème des moments
2 - Echantillonnage
3 - Count-Min sketch
4 - Extensions

Evaluation

La validation de cette UV est basée sur un contrôle continu, des séances de travaux pratiques et un contrôle écrit.

Formule de l'évaluation

Note de participation (NP)
Note de TP (TP)
Note de contrôle continu CC = (NP+TP)/2
Examen écrit (EC)
Notes finale NF = max ((CC+EC)/2, EC)

Bibliographie

Data Streams : algorithms and applications, S. Muthukrishnan

Fiche mise à jour le 11/06/2019