Extrait de l'émission CPU release Ex0225 : Synthèse vocale, seconde partie.
On vous a concocté un lexique très grossier (mais sans gros mots) pour ceux qui n'ont pas encore écouté notre précédente émission, qui est toujours disponible en ligne.
- Phonème
-
Un phonème est un son. Du type voyelle
a
ou consonner
. Mais il y a aussi les sons composés commean
,ou
,pa
, les diphtongues commemoins
. Les syllabes sont des composées de phonèmes. - Accentuation
-
En Français, l'accentuation sert surtout à connaitre si une phrase est exclamative, interrogative ou neutre. Dans certaines langues, comme l'espagnol, les mots ont chacun une accentuation dite
tonique
qui permet de distinguer les mots entre eux. Dans certaines langues comme le mandarin, une même syllabe peut avoir jusqu'à 6 sens différents, donc 6 mots bien distincts en fonction de l'accentuation de sa prononciation. - Rire
- Eh oui, les synthèses vocales savent même rire… et c'est plutôt inquiétant. Hein Alexa ?
- Silence
-
On ne s'en rend pas compte, mais le silence est une expression utile dans la diction ; pour placer une virgule, pour changer de phrase… La respiration et la déglutition sont désormais reproductibles en synthèse vocale pour leurrer l'humain et lui faire oublier qu'il écoute une machine.
On va même vous dévoiler les coulisses de notre émission CPU : dans l'écriture de nos textes, on a un petit guide de référence typographique, une petite convention informelle pour utiliser la ponctuation, ceci afin de nous aider lors de l'enregistrement de nos chroniques à l'oral. Songez-y : On utilise la ponctuation pour aider à dire un texte écrit car elle sert aussi à poser notre respiration. - Respiration
-
(Alors, pour ce mot, il faut que je pense à ne pas supprimer mes bruits de respiration et à vous laisser le son brut de l'enregistrement).
La nouveauté des synthèses vocales depuis une dizaine d'années est de simuler une respiration, voire des bruits de bouche, afin de paraître nettement plus humain. Quand on s'en rend compte, cela peut devenir très perturbant. - Glottophobie
- Les synthèses vocales primitives étaient dénigrées pour leurs prononciations qui n'étaient pas exactement dans le standard de la langue des humains. De nos jours, étonnement, on salue l'expression d'accents régionaux par une synthèse vocale, comme un marqueur de terroir et un témoignage de respect pour une région. Ainsi, dans notre zone de radiation hertzienne, à Toulouse, une partie des usagers des transports en commun se plaignaient que les annonces dans le métro furent enregistrées par une humaine avec un accent de terroir, tandis que celles des bus venait d'une voix synthétique en locale jacobiniste parisieng, ce qui passe très mal dans la cité depuis la croisade des albigeois en 1229, ou depuis que les Parisiengs du Stade Français sont capable de foutre une branlée à notre Stade Toulousaing.
Textes : Da Scritch
Illustration : Capture d'écran du clip « Music non stop » par Kraftwerk. D.R.