Traitement avancé des Images et du son
Télécharger le fichier PDF (132 KB)
Objectif de l'unité d'enseignement
Cet enseignement a pour objectif de proposer aux étudiants un approfondissement des connaissances dans les technique de traitement des images et du son. Les méthodes de traitement des images sont abordées par la pratique et de façon progressive : les notions théoriques jusqu'au techniques les plus évoluées sont étudiées et illustrées par des exemples, certains devant être traités par les étudiants (détection, reconnaissance d'éléments, puis segmentation et tracking dans une séquence d'images par exemple). Concernant l'aspect sonore, diverses techniques avancées sont étudiées, la plupart dans le cadre de l'«analyse computationnelle de scène auditive». Les étudiants doivent être capables d'exploiter un capteur sonore binaural ou constitué d'une antenne de microphones afin d'analyser et d'interagir avec un environnement acoustique complexe et dynamique. Différentes problématiques sont abordées : localisation de sources sonores, séparation et reconnaissance de locuteurs, reconnaissance de parole.
Contenu de l'unité d'enseignement
- Filtrage adaptatif et filtrage de Kalman pour la modélisation des signaux 1D et 2D
Traitement avancé des images :
- Méthodes variationnelles pour la segmentation et le tracking des contours : contours actifs et level set.
- Segmentation/partitionnement de l'image par des techniques de graphcut.
- Représentation parcimonieuse de l'image (compressive sensng).
- Détection (approche multi-échelles), caractérisation et appariement de points d'intérêt
- Détection de régions en mouvement dans les séquences d'images, estimation du mouvement
- Corrélation, flot optique, suivi de trajectoires, étude déterministe et probabiliste, mean-shift, applications du filtre de Kalman et du filtrage particulaire en image.
Traitement avancé du son :
- Rappels d'acoustique : modèle et hypothèses de propagation, source sonore faible/large bande
- Localisation de sources sonores : méthode haute-résolution MUSIC, formation de voie, méthodes binaurales
- Introduction à la séparation de sources sonores
- Analyse du signal de parole, extraction de paramètres et reconnaissance (de parole, de locuteur)
pré-requis
Mathématiques (probabilité, statistique), traitement du signal (échantillonnage, transformées discrètes), théorie de l'information
Modalités de contrôle des connaissances
Contrôle continu, notes de TP
Références bibliographiques
Digital Image processing, Rafael C. Gonzalez, Richard E. Woods, Addison-Wesley Pub (Sd) ; 3rd edition Optimum Array Processing (Detection, Estimation, and Modulation Theory, Part IV), Harry L. Van Trees, Wiley-Interscience
Egalement dans la rubrique
Contact
Responsable :
Catherine ACHARD
catherine.achard (at) upmc.fr
Secrétariat :
Florence GIANGRANDE
florence.giangrande (at) upmc.fr