Parole et Son

Catalogue des cours de Télécom SudParis

Code

SIC 4508

Niveau

Graduate (M1)

Période

Spring (P3)

Domaine

Signal et Communications

Langue d'enseignement

Français

Crédits ECTS

4

Heures programmées / Charge de travail

45 / 90

Responsable(s)

  • DESBOUVRIES Francois

Département

- Communications, Images et Traitement de l'information

Equipe pédagogique

  • CASTELLA Marc
  • BOUDY Jerome
  • PETROVSKA Dijana

Objectif

- Maîtriser l’analyse et la synthèse de la parole.
- Connaitre les techniques de reconnaissance automatique de la parole et du locuteur.
- Appréhender les techniques de séparation de sources sonores.

Contenu

- Codage de la parole
- Production et perception de la parole. Les niveaux acoustique et phonétique. - Phénomènes de masquage. Sons voisés et non voisés.
- Modélisation, analyse et synthèse du signal de parole.
- Codage par prédiction linéaire.
- Quantification vectorielle. Codeurs CELP. Codage à bas débit.
- Le codeur GSM à 13 kbits/s.
- Formats audio et codage perceptuel
- MP3, MPEG4, CD, DVD, SACD, DAT, DCC …
- Reconnaissance automatique de la parole
- Modèles de Markov cachés
- Extraction des paramètres
- Problème de compression, débruitage, robustesse à l’environnement
- Reconnaissance de parole multi-locuteurs, grand vocabulaire
- Vérification du locuteur
- Reconnaissance de parole distribuée, standards ETSI
- Application aux serveurs de reconnaissance vocale
- Synthèse de parole à partir du texte (“Text-to-Speech”)
- Synthèse par prédicteur linéaire, problèmes de stockage, de qualité, TTS distribuée
- Messagerie unifiée (dictée ou écoute d’e-mails), aide aux personnes malvoyantes.
- Séparation de sources
- Mélanges instantanés, convolutifs, sous-déterminés...
- Méthodes de séparation, analyse en composantes indépendantes
- Application aux signaux sonores.

Prérequis

Connaissances de base en théorie du signal (échantillonnage, corrélation, représentation spectrale …)

Mots-clés

Analyse / synthèse de la parole, reconnaissance de la parole, codage de la parole à bas débit, formats audio, codage perceptuel, séparation de sources

Evaluation

 

Approches pédagogiques

 

Programme

Programme Ingénieur

Fiche mise à jour : 20/12/2016 14:52:34