Extrait de l'émission CPU release Ex0214 : Disséquons une URL, seconde partie.
Ceci est la suite de notre émission release Ex0213 Disséquons une URL, première partie. Si vous ne l'aviez pas écoutée, vous pouvez l'entendre à tout moment ou lire les textes.
Dans notre précédente release, on a tenté d'expliquer ce qu'est qu'une URL, cette longue chaine de caractère qui est en haut de votre navigateur web. Pour rappel, c'est un assemblage de segments de texte, d'atomes, avec des symboles préfixant chaque élément.
En anglais, on la décrit ainsi :
scheme : // authority / path ? query # hash
Dans sa traduction française :
plan : // autorité / chemin ? requête # fragment
Enfin , comme on l'explique à notre manière :
comment : // chez_qui / où ? question # extrait
Sachant que dans la partie de l'autorité, on a d'autres éléments accessoires. Et que dans le chemin, on a une arborescence de répertoires et un nom de fichier. Et que chacun de ces atomes est accessoire, aucun élément n'est obligatoire et qu'ils ont des valeurs par défaut, d'où l'intérêt de mettre un symbole détrompeur.
Ce flou dans un outil standard et universel a aidé à son adoption, mais il est aussi sujet de nombreux maux de têtes. Daniel Haxx, le créateur de curl
, un petit outil d'administration très puissant qui récupère des données à partir d'URL, expliquait dans son blog en 2016 qu'il existe des variations dans le standard qui tournent littéralement au cauchemar en termes d'interopérabilité. Un comble pour un outil d'adressage universel.
Mais on n'y est pas encore.
Je vous avais laissé à la fin de l'émission précédente dans le chemin, le path, la représentation de l'arborescence de fichier du serveur.
Texte : Da Scritch
Illustration : Open Sourcing URL-Detector par Linkedin Engineering, D.R.