Extrait de l'émission CPU release Ex0225 : Synthèse vocale, seconde partie.
Pour lire un mot à voix haute, comme je le fais en ce moment, mon cerveau transforme les mots écrits en français en leur correspondance vocale en français oral. Je transforme donc inconsciemment des mots en phonèmes à exprimer et à articuler. C'est exactement le même modèle qui est fait en synthèse vocale, car en général, on envoie à la fonction de synthèse vocale une chaine de caractère où les mots sont écrits de manière lisible par les humains. Cette fonction comporte donc une sous-fonction de transcription phonétique, en général, dans un des multiples systèmes d'écritures phonétiques qui existent, comme l'IPA, L'Alphabet Phonétique International, celui que vous trouvez dans les dictionnaires, mais il existe d'autres alphabets phonétiques.
Le français est une langue à écriture syllabique, et non pas idéographique, donc pour la lire à voix haute, on n'a pas besoin d'apprendre chaque mot de son vocabulaire, mais les lettres expriment des sons. Et donc théoriquement, on n'a qu'à connaître les 19 consonnes et 13 voyelles phonétiques, soit 32 sons utilisés naturellement en Français, pour dire un mot sans le connaitre.
Et pourtant, cocorico, le Français est une langue compliquée à apprendre à lire, tous les enseignants en primaire vous le diront. Ceci malgré ou à cause des efforts de l'Académie Française. Rien que les dix premiers nombres en français… chacun d'entre eux comporte au moins une exception phonétique, souvent unique dans la langue. Si si. Fermez les yeux, et pendant que je compte, rappelez-vous de leur orthographe : un, deux, trois, quatre, cinq, six, sept, huit, neuf, dix.
Entres autres difficultés, on a un nombre incroyable de cas de lettres non-vocales en Français. Là où en anglais, quasiment toutes se lisent, il y a très peu de lettres muettes à l'exception du k
en début de mot suivi par une autre consonne.
La transcription phonétique est l'étape d'apprentissage en lecture la plus importante, et certaines langues s'apprennent plus vite quand leur alphabet est purement phonétique comme le hangeul en coréen ou les kana en japonais.
Cette étape est donc aussi complexe pour les humains, et donc un souci récurrent dans l'éducation. Ainsi, dans les années 1960s, pour faciliter la lecture, des enseignants britanniques ont essayé un alphabet semi-phonétique, l'ITA, qui comportait 44 caractères. Il ne s'agissait pas de remplacer l'alphabet latin, mais de simplifier la transcription phonétique chez les enfants. Eh oui, on pourrait penser que l'ITA est inspiré de l'IPA l'alphabet phonétique international, mais c'est faux notamment parce que l'ITA ne va pas faire d'indication d'accent, ce qui aurait pénalisé les gallois, les écossais et surtout les cockney.
Sauf que faire apprendre un double alphabet à des enfants a mené parfois plus d'échecs scolaires que ce qui était voulu ; finalement, ce système d'écriture a été abandonné.
Il a existé un système aux même finalités en Français, mais dont l'origine n'était pas éducatif mais ironique : l'ortograf fonétik popularisée par Raymond Queneau dans son néo-français pour se moquer de l'Académisme parisien, et qui a été adopté par des éducateurs réunis au sein de l'association Alfonic.
De nos jours, il existe des bibliothèques de transcription phonétique. Par exemple OpenIPA où l'on peut passer un texte français en IPA. Mais comme je viens de le dire, l'IPA est une transcription qui implique un accent particulier. Au hasard, un accent parisien.
Textes : Da Scritch
Illustration : Capture d'écran du clip « Music non stop » par Kraftwerk. D.R.