Extrait de CPU release Ex0017 : Lost+found (volume 3), chronique originellement prévue pour CPU release Ex0005 : Mémoire humaine et mémoire numérique.
3,3
Aux tous débuts du web apparurent très vite des sites pour trouver d'autres sites. On avait d'un coté les index, tels que Yahoo!, où il faut inscrire un site web pour qu'il y soit référencé avec une petite explication et une suggestion de catégorie. Yahoo! classait les sites entre Arts
, Business
, Informatique
, Santé
, et en navigant dans ses sous-catégories, on espérait être au bon endroit pour trouver La réponse à Sa question.
D'un autre côté, nous avions les premiers agents d'indexations qui nourrissaient les premiers moteurs de recherches.
Altavista fut le premier proof of concept de cette technologie ; il fut construit et lancé par le fabriquant de super-ordinateurs Digital sur les travaux de Paul Flaherty, Louis Monier et Michael Burrows. Altavista était d'ailleurs un projet de recherche sur la manière de stocker et retrouver une information sans passer par une base de données traditionnelles dite relationnelle
(RDBMS).
Le système fonctionnait par des agents logiciels, les spiders, qui parcouraient toutes les pages web connues d'Altavista, pour chercher de nouveaux contenus. Le site web du moteur de recherche proposait non pas une liste de mots clés à parcourir, mais un champ texte libre, pour effectuer ce que l'on appelle une recherche full-text
, c'est à dire en tentant de retrouver les pages qui comportent le plus de mots donnés par rapport à une question posée en langage naturel et de là, proposer les résultats de la manière jugée la plus pertinente.
Le travail effectué sur Altavista allait aussi bien inspirer d'autres moteurs de recherches à venir, comme Google qui apparu bien plus tard, que des bases de données dites NoSQL
. Quant à sa technologie des spiders, ces fameux agents logiciels qui parcourent la toile du net pour trouver de nouveaux sites et contenus, il entraîna la création des métadonnées d'indexations dans les pages web, notamment la fameuse balise <meta description="">
.
Lancé publiquement fin 1995, Altavista fut immédiatement un succès public, par sa facilité d'usage, et surtout son coût gratuit pour les visiteurs.
Altavista permettait aussi d'avoir une réponse à la logique floue. Par exemple, il était possible d'indiquer une recherche sur une période donnée. Disons que nous faisons une recherche sur un document concernant les années 1970s, il suffisait de mettre NEAR 1970 and 1979
dans sa requête. Il était aussi possible de supprimer les réponses en fonction de certains mots clés, ou de faire des recherches sur des débuts de mots.
Il disposait de plus d'un moteur de traduction automatique réellement performant pour l'époque : Babelfish, ainsi nommé en référence au Poisson de Babel dans le célèbre roman de science-fiction « Le Guide du Routard Galactique » de Douglas Adam.
Altavista, donc, était accessible par un sous-domaine de la société Digital : son url était altavista.digital.com
.
Mais très vite, Altavista devint un point obligé d'usage d'internet, avec un trafic sans cesse grandissant.
Deux ans après sa création, en 1997, le site Altavista était connu par la majorité des internautes, il était probablement le site web le plus visité de l'époque et vivait grâce à un budget sponsorisé de 70 M$ annuel. Yahoo abandonnait sa stratégie d'un index par enregistrement volontaire des sites web, et signe un contrat de partenariat : les résultats présentés par yahoo.com furent ceux retournés par le moteur AltaVista.
Pendant ce temps là, la société Digital fut rachetée par le fabriquant de PC Compaq.
L'activité des super-ordinateurs intéressaient peu Compaq devant la possibilité de mettre des PC nettement moins onéreux en réseaux, il s'agissait d'une activité de prestige.
Par contre, devant l'explosion du trafic sur internet, le moteur Altavista fut transformée en véritable filiale. En 1998, le nom de domaine altavista.com
fut racheté 3,3 M$, l'objectif était clair : transformer une expérience plus que réussie en véritable site très grand public au moment où Mme Michu de l'Illinois allait pouvoir magaziner sans affronter le blizzard de la région des Grands Lacs.
À ce moment-là, l'ensemble des grands sites suivaient une stratégie de portail ; c'est à dire que l'ensemble des contenus proposés par lesdits portails ne devaient pas vous inciter à quitter le site où vous étiez.
Plantage !
Malheureusement, en suivant cette stratégie, Altavista dépérit très très vite au début des années 2000. Entre un webmail, un service de vente en ligne, un autre d'actualité généraliste, le moteur de recherche fut donc bien moins visible, et eu un effort de développement bien moins soutenu. Les actionnaires d'AltaVista avaient entrepris les démarches pour faire entrer l'entreprise en Bourse, mais l'éclatement de la bulle internet en 2001 contrariât les projets, et asséchât par la-même occasion contrats juteux et revenus publicitaires.
Au même moment, un nouvel acteur, Google, proposait un moteur de recherche au design très très épuré. Et Google s'intéressa au problème des indexations sauvages faites par certaines entreprises, conseillés par ce que l'on appela les S.E.O., des spécialistes autoproclamés en optimisation d'indexation. En effet, le travail de mercenaire des S.E.O. est d'abuser des algorithmes d'indexations pour se retrouver le plus haut possible dans les moteurs de recherche. Un peu comme la publicité sauvage qui, à force de s'inviter dans ton cerveau, crée des automatismes qui n'ont fonctionnellement aucune raison d'être.
Altavista devenait donc moins pertinent dans ses réponses par cette pollution, là où Google a fait autant que possible pour les contenir, mais surtout pour inciter à utiliser de préférence ses propres espaces publicitaires clairement identifiés.
Le moteur de recherche issu des laboratoires de Digital commença à dépérir très vite. Par le jeu des acquisitions, Yahoo! racheta Altavista à HP en 2004, et le mis de côté, mettant en avant son moteur de recherche maison, Inktomi, avant que Yahoo! ne décide de fermer le service en 2013. Le nom de domaine altavista.com
reste actif surtout pour sa notoriété passée, et renvoie sur une page étonnement simple et lisible du moteur de recherche de Yahoo.com, lequel est motorisé actuellement par la technologie Microsoft Bing. Et sans point d'exclamation cette fois-ci.
La baliste HTML <meta description="">
n'a plus d'utilité depuis une dizaine d'années, sans parler de <meta keywords="">
, qui n'en a plus eu depuis 1998. Mais comme les bonnes choses ne meurent jamais, il y reste comme une superstition qui fait que de nombreux spécialistes S.E.O.
recommandent encore de le garder.
On ne sais jamais, au cas où...
Auteur : DaScritch
Illustration graphique : Gyrus Dentatus 40x
par MethoxyRoxy, licence CC BY-SA 2.5 via Commons.