Extrait de l'émission CPU release Ex0147 : Codecs du son.
Dès qu'on parle d'audition et de qualité de restitution, le point Godwin commence à pointer son nez car invariablement quelqu'un dans la salle va évoquer l'oreille absolue
. Si des sons très ténus pourraient être discernables dans un vacarme après un long, très long entraînement et chez des personnes plutôt jeunes, le parti-pris dans les codecs de compression audio lossy est de viser l'acceptable pour l'immense majorité du public humain avec des objectifs de réduction importantes de débit.
Bon, ces partis-pris ont bon dos. Les concepteurs de codecs ont fait ce qu'ils ont pu avec ce que l'on avait comme outils mathématiques à l'époque, comme puissance logicielle et matérielle financièrement accessibles et surtout comme retours. Et puis des fois, ils ont eu des décisions… euh… ouais… des décisions qui pèsent lourd de nos jours.
Ainsi les premiers algos de la branche MPEG-1 travaillaient en jouant sur l'interpolation entre certaines fréquences.
Alors, je dis MPEG-1
, mais il faut comprendre que ce que vous avez appelé mp3
désigne une petite portion de ce standard, un des codecs audios possibles dans ce container, le MPEG 1 Layer III. Et avant ça, y'a eu du mp2
ou MPEG 1 Layer II, appelé Musicam
, utilisé dans le monde professionnel comme la radio ou la télévision jusqu'au début 2015. Y'a eu aussi, vous vous en doutez, un mp1
ou MPEG 1 Layer I, mais son usage est resté totalement anecdotique.
Car il faut se rappeler que MPEG
veut dire Motion Picture Expert Group
. Le groupe de travail formé en 1988, a pour mission initiale de produire le premier standard de stockage de vidéo numérique sur CD-Rom à 1,5 Mbit/s. C'était l'idée en 1993, et de là on en a tiré des sous-formats pour le son. Un peu comme pour le support Laserdisc qui a servi à définir le CD Audio.
Derrière ces codecs audio du MPEG, il y a l'Institut Fraunhofer pour les télécommunications. Et à l'audition des sons encodés avec leur algo mp3… on se dit que les concepteurs étaient sourds : le son manque de clarté dans les aigus. Et pour cause : le standard originel d'encodage prévoyait un filtre passe-bas qui atténue les sons au-dessus de 10 kHz.
Franchement, on va être honnête : les codecs du mp2 et du mp3 ont été figés pour l'écriture du standard MPEG en… 1992… À l'époque, un processeur d'un PC haut de gamme n'arrivait pas à le décoder en temps réel à un débit de 128 kbits/s, l'encodage demandait lui plusieurs heures pour une minute. Les premières applications demandaient des puces dédiées.
Pour décider quel sera le codec de référence entre mp2 et mp3, l'histoire veut que la chanson « Tom's Diner » de Suzanne Vega, dans sa version a cappella fut choisie pour effectuer les tests en double aveugle ; Karlheinz Brandenburg, l'un des développeurs du format, a considéré que le timbre de la voix de Suzanne Vega serait particulièrement complexe à compresser sans trop faire perdre ses caractéristiques. La chanteuse américaine l'a appris plus tard et ayant écouté un des fichiers de tests, elle l'aurait très mal pris.
(à moins que cela soit [la crainte de] la comparaison avec [Lena Forsen] dans Playboy qui a servi de test pour scanner et les premiers JPEG).
Avec le temps, nous avons simplement oublié que ces codecs répondent à des contraintes dictées il y a 30 ans. Et qu'il faut un temps monstre entre la conception d'un codec, sa validation comme standard, son implémentation dans des puces spécialisées, l'intégration dans du matériel, la vente de ce matériel et son installation chez le grand public.
Alors imaginez quand il faut mettre à jour l'ensemble parce que le codec est dépassé.
pas top du tout.
Il se trouve qu'au Royaume-Uni, chaque radio a le choix du débit qu'il peut utiliser dans son multiplexe DAB+, mais ce débit lui est taxé. Donc inutile de vous dire que les radios commerciales ont préféré privilégier un petit débit, quitte à n'émettre qu'en mono. Indeed, au Royaume-Uni, des radios britanniques musicales diffusent en mp2 avec un débit famélique de 80 kbits/s. Comme du mp3 à 56 kbits/s… Un débit qu'elles ont encore réduit avec le changement de codec : elles l'ont divisé par deux. Elle sen profitent financièrement, mais l'auditeur n'a pratiquement rien gagné.
Ben oui, ça pique les neurones quand on le sait.
Je te dis pas les artefacts derrière…
Et autant on a des artefacts quand le débit n'est pas suffisant, autant… l'encodeur crée des artefacts s'il n'arrive pas à obtenir le bon débit.
Car l'encodeur fait ce qu'on lui dit, et si on lui a fixé le débit à sortir à 128 kbits/s et qu'il a un silence en entrée… il arrive fréquemment que l'encodeur croient entendre des bruits, tente de les encoder et donc… en génère.
La preuve en enregistrant un silence, on l'encode, le décode, et on amplifiant la sortie.
Il se trouve que dans le container MPEG, on peut insérer des blocs de données blanches pour compléter un débit, ce qui était le cas par exemple sur les cassettes numériques DCC dont le défilement de bande était un poil plus rapide que le débit d'encodage.
Bashage gratuit à part, les travaux du consortium MPEG sont passionnants. Quand on critique leurs travaux, on oublie que ces standards furent conçus il y a des décennies. Et que le gros problème est de renouveler l'ensemble de la chaîne matérielle.
Texte : Da Scritch
Illustration : iPod Apple deuxième génération, via aventure-apple.com, D.R.