Extrait de l'émission CPU release Ex0147 : Codecs du son.
La compression sans perte en audio a beaucoup de difficultés à réduire le débit nécessaire ; dans des conditions ultra-favorables, on peut réduire la taille du fichier à un quart de celui de la source. Pour les années 1980s, c'est pas assez. Donc des ingénieurs se sont tournés vers la compression du son avec pertes, utilisant les transformées de Fourier, des transformations trigonométriques, des recherches de fréquences harmoniques.
En soit, la compression lossy va tenter de reconstruire une approximation du son originel.
La première des opérations d'un encodeur audio dit lossy est de supprimer ce qui ne serait pas physiologiquement audible : Les ultrasons et les infrasons.
Selon les définitions, les ultrasons sont des fréquences supérieures à 16 kHz, voire 20 kHz et les infrasons les sons inférieurs à 25 Hz voire 12 Hz. À noter qu'il est possible pour des individus normaux
d'entendre dans les limites proches de ces fréquences, mais à des niveaux sonores très forts, voire dangereux. Comme on veut reproduire ce qui est raisonnablement
audible pour un humain, ces fréquences sont sabrées sans état d'âme.
Lame, actuellement considéré comme le meilleur encodeur mp3 disponible, coupe ainsi toute fréquence au delà de 16,5 kHz dans ses réglages les plus courants. Nous verrons plus tard pourquoi il le fait et pourquoi à cette fréquence.
Ensuite il y a des bruits ténus quand un bruit est mille fois plus fort devant, qu'on ne va même pas tenter de restituer, l'encodeur va considérer qu'il s'agit de bruit de fond, négligeables, et donc va les lisser ou les faire disparaître. La plupart des encodeurs vont d'abord essayer de distinguer si le signal ténu est une fréquence harmonique ou non de la fréquence la plus forte, pour éviter de trop dénaturer le son.
Texte : Da Scritch
Illustrations sonores : Streety « Sword» CC-0, Kyles « Axe chop into wood little debris » CC-0
Photo : Axe wood tree CC besnopile via Pixabay, détail