Titre : Le PAT : un outil d'élargissement de la bande audio pour le codage bas débit

Auteurs : P. Collen et J-B. Rault

Laboratoire (s) : France Telecom R&D

Résumé :

La limite actuelle de transparence des codeurs perceptifs pour des sons génériques (parole et musique ) peut être fixée à environ 64 kbitfs par voie (à comparer aux 700 kbitfs par voie d'un CD audio). En deçà de cette limite et en fonction du débit, des compromis doivent être faits pour conserver une qualité acceptable. Un des compromis les plus courants consiste à limiter la bande passante de façon à réduire le nombre d'informations à coder et ainsi limiter la distorsion. Cette perte de contenu haute fréquence entache alors considérablement la richesse des signaux. Le principe de l'élargissement de bande consiste donc à re-synthétiser, au décodeur, les hautes fréquences non transmises à partir des basses fréquences et d'un minimum d'informations complémentaires. Dans ce papier, nous présentons l'outil d'extension de la bande passante développé par France Telecom et soumis comme candidat dans le cadre du projet DRM (Digital Mondiale Radio) et dans la phase de normalisation MPEG-4. Le PAT (Perceptual Audio Transposition) s'appuie sur l'utilisation de deux codecs indépendants : le premier est un codeur audio "classique" qui peut être de parole ou musical. Le second est le codeur PAT qui se place après le premier codeur et qui vise à reconstituer les aigus non transmis par le premier codeur. Le principe est donc de limiter volontairement la bande passante du premier codeur pour économiser du débit sans ajouter de distorsion supplémentaire, le codeur PAT se chargeant alors de reconstituer les aigus pour un débit très faible (de l'ordre de 2 kbitfs). Une première partie rappellera les principes généraux de cette technique et l'état de l'art en la matière. Puis nous présenterons la technique d'enrichissement spectral retenue dans le PAT en nous attachant notamment à développer les ajustements nécessaires pour certains types de signaux particuliers tels que les harmoniques et les signaux transitoires. Enfin nous présenterons son utilisation conjointe avec un codeur AAC (MPEG-4 ) pour un débit de 24 kbits/s et étudierons les performances de ce codeur pleine bande bas débit à l'aide de résultats de tests subjectifs.