Traitement avancé des Images et du son

Objectif de l'unité d'enseignement

Cet enseignement a pour objectif de proposer aux étudiants un approfondissement des connaissances dans les technique de traitement des images et du son. Les méthodes de traitement des images sont abordées par la pratique et de façon progressive : les notions théoriques jusqu'au techniques les plus évoluées sont étudiées et illustrées par des exemples, certains devant être traités par les étudiants (détection, reconnaissance d'éléments, puis segmentation et tracking dans une séquence d'images par exemple). Concernant l'aspect sonore, diverses techniques avancées sont étudiées, la plupart dans le cadre de l'«analyse computationnelle de scène auditive». Les étudiants doivent être capables d'exploiter un capteur sonore binaural ou constitué d'une antenne de microphones afin d'analyser et d'interagir avec un environnement acoustique complexe et dynamique. Différentes problématiques sont abordées : localisation de sources sonores, séparation et reconnaissance de locuteurs, reconnaissance de parole.

Contenu de l'unité d'enseignement

- Filtrage adaptatif et filtrage de Kalman pour la modélisation des signaux 1D et 2D

Traitement avancé des images :

- Méthodes variationnelles pour la segmentation et le tracking des contours : contours actifs et level set.

- Segmentation/partitionnement de l'image par des techniques de graphcut.

- Représentation parcimonieuse de l'image (compressive sensng).

- Détection (approche multi-échelles), caractérisation et appariement de points d'intérêt

- Détection de régions en mouvement dans les séquences d'images, estimation du mouvement

- Corrélation, flot optique, suivi de trajectoires, étude déterministe et probabiliste, mean-shift, applications du filtre de Kalman et du filtrage particulaire en image.

Traitement avancé du son :

- Rappels d'acoustique : modèle et hypothèses de propagation, source sonore faible/large bande

- Localisation de sources sonores : méthode haute-résolution MUSIC, formation de voie, méthodes binaurales

- Introduction à la séparation de sources sonores

- Analyse du signal de parole, extraction de paramètres et reconnaissance (de parole, de locuteur)

pré-requis

Mathématiques (probabilité, statistique), traitement du signal (échantillonnage, transformées discrètes), théorie de l'information

Modalités de contrôle des connaissances

Contrôle continu, notes de TP

Références bibliographiques

Digital Image processing, Rafael C. Gonzalez, Richard E. Woods, Addison-Wesley Pub (Sd) ; 3rd edition Optimum Array Processing (Detection, Estimation, and Modulation Theory, Part IV), Harry L. Van Trees, Wiley-Interscience

Jennyta Bara - 02/12/15

Traductions :

Egalement dans la rubrique

Contact

Responsable :

Catherine ACHARD

catherine.achard (at) upmc.fr

Secrétariat :

Florence GIANGRANDE

florence.giangrande (at) upmc.fr