Extrait de l'émission CPU release Ex0147 : Codecs du son.
C'était la question qui titillait des labos et les différentes institutions des télécoms dans les années 1970s : Comment arriver à passer à la transmission audio Hi-Fi en numérique ? Oui, parce que de l'audio en basse qualité, on savait déjà faire en téléphonie, et cela n'excitait pas grand-monde.
Car on parle aussi de compression numérique, laquelle était très vite devenue indispensable dans les premières heures du son numérique, et les technologies impliquées n'ont évidemment rien à voir avec ce qui existait jusque-là.
La compression de données numériques consiste à réduire le débit de données nécessaires pour la reproduction d'un son selon un algorithme donné.
Il y a deux types de compressions :
-
Il y a la compression lossless, sans perte, comme les fichiers
.zip
, les images PNG ou le son en compression différentielle.flac
. Entre l'entrée et la sortie, le document original et la version décompressée sont strictement identiques.
Le fichier compressé est un peu plus petit, mais le ratio n'est pas décoiffant. Autre problème : ce ratio ne peut pas être constant, ou alors en faisant du remplissage avec de la donnée inutile. -
Et il y a la compression lossy, avec perte, comme le JPEG, le mp3 ou les débats politiques sur les réseaux sociaux. Le résultat décompressé a moins de détails que le document original, mais le fichier résultant est bien plus petit. À la conception de l'algorithme, on va définir les qualités et défauts de ce codec, et donc son domaine d'usage. Une
stratégie
comporte entre autres le type de détails qu'on ne restituera pas et les artefacts que l'on va considérer commeacceptables
. On peut décréter un débit maximal en sortie.
use case
qui leur est destinée. Par exemple le format µ-law : vous avez du mal à me croire qu'on a là une compression sans perte, mais ce format créé dans les années 1970s est prévu pour du son numérique en 8 bits 8 kHz, car son usage principal est la téléphonie.
Idem pour les codecs lossy : le mp3, l'AAC et le ogg vorbis, que nous utilisons pour diffuser notre émission radio en podcast, sont prévus principalement pour de la musique avec un débit confortable, alors que les codecs GSM, ogg-speex ou HE-AAC sont prévus pour de la téléphonie.
Cet use case va dicter le cahier des charges, ce qui conditionne les fréquences qui peuvent être reconstituées, le nombre de canaux sons, la dynamique, la précision des détails et le débit optimal en sortie. Et comme pour la plupart des logiciels, il vaut mieux savoir quel est l'usage cible d'un codec avant de tenter d'en faire n'importe quoi, car vous manquez sûrement l'occasion d'utiliser un outil bien plus approprié.
Texte : Da Scritch
Photo : Extrait de l'excellent site 2m40.com, un blog impactant, D.R., détail.