[Accueil bibliotech]
Accueil > Les thèses en ligne de l'INP

Masquage de pertes de paquets en voix sur IP

Koenig, Lionel (2011) Masquage de pertes de paquets en voix sur IP. (Packet loss concealment on voice over IP.)

Texte intégral disponible au format :

PDF - Nécessite un logiciel de visualisation PDF comme GSview, Xpdf ou Adobe Acrobat Reader
1.64 Mo

Résumé

Les communications téléphoniques en voix sur IP souffrent de la perte de paquets causée par les problèmes d'acheminement dus aux nœuds du réseau. La perte d'un paquet de voix induit la perte d'un segment de signal de parole (généralement 10ms par paquet perdu). Face à la grande diversité des codeurs de parole, nous nous sommes intéressés dans le cadre de cette thèse à proposer une méthode de masquage de pertes de paquets générique, indépendante du codeur de parole utilisé. Ainsi, le masquage de pertes de paquets est appliqué au niveau du signal de parole reconstruit, après décodage, s'affranchissant ainsi du codeur de parole. Le système proposé repose sur une modélisation classique de type « modèles de Markov cachés » afin de suivre l'évolution acoustique de la parole. À notre connaissance, une seule étude a proposé l'utilisation des modèles de Markov cachés dans ce cadre [4]. Toutefois, Rødbro a utilisé l'utilisation de deux modèles, l'un pour la parole voisée, l'autre pour les parties non voisées, posant ainsi le problème de la distinction voisée/non voisée. Dans notre approche, un seul modèle de Markov caché est mis en œuvre. Aux paramètres classiques (10 coefficients de prédiction linéaire dans le domaine cepstral (LPCC) et dérivées premières) nous avons adjoint un nouvel indicateur continu de voisement [1, 2]. La recherche du meilleur chemin avec observations manquantes conduit à une version modifiée de l'algorithme de Viterbi pour l'estimation de ces observations. Les différentes contributions (indice de voisement, décodage acoutico-phonétique et restitution du signal) de cette thèse sont évaluées [3] en terme de taux de sur et sous segmentation, taux de reconnaissance et distances entre l'observation attendue et l'observation estimée. Nous donnons une indication de la qualité de la parole au travers d'une mesure perceptuelle : le PESQ. ABSTRACT : Packet loss due to misrouted or delayed packets in voice over IP leads to huge voice quality degradation. Packet loss concealment algorithms try to enhance the perceptive quality of the speech. The huge variety of vocoders leads us to propose a generic framework working directly on the speech signal available after decoding. The proposed system relies on one single "hidden Markov model" to model time evolution of acoustic features. An original indicator of continuous voicing is added to conventional parameters (Linear Predictive Cepstral Coefficients) in order to handle voiced/unvoiced sound. Finding the best path with missing observations leads to one major contribution: a modified version of the Viterbi algorithm tailored for estimating missing observations. All contributions are assessed using both perceptual criteria and objective metrics.

Département ou laboratoire:Institut de Recherche en Informatique de Toulouse - IRIT (Toulouse, France)
Directeur de thèse:André-Obrecht, Régine et Mailhes, Corinne
Mots-clés:Modèle de Markov caché - Masquage de pertes de paquets. KEYWORDS : Voice over IP - Packet loss concealment - Hidden Markov Model - Voicing percentage - Unsupervised HMM training
Sujets:Télécoms et réseaux > Signal, image et acoustique
Electronique > Signaux, images et télécommunications
Télécoms et réseaux > Traitement du signal
Déposé le:26 Mai 2011

Administrateur seulement : modifier cet enregistrement


Contacts | Infos légales | Plan du site | Intranet

(c)INP de Toulouse 2012 - Tous droits réservés. -  INP Communication