TUTORIEL ALGO/METHODES 
Expliquez-moi... le PageRank Google
Quels sont les différents critères pris en compte par le célèbre moteur de recherche pour classer les sites Web ? Comprendre pour mieux être référencé. (12/12/2005)
Si les algorithmes internes de Google sont secrets et complexes, il est possible de discerner certains comportements, et en les prenant en compte, d'assurer une meilleure visibilité à ses pages Web. Voici quelques exemples.

La base fondamentale du fonctionnement de Google est le lien, tant entrant que sortant. À partir du nombre de liens pointant vers un site ou une page, Google peut établir l'importance de la cible, et donc lui accorder une certaine confiance. Plus un site sera lié, plus il sera considéré comme une référence, et sera donc mis en valeur par rapport à d'autres.

Cette confiance que créé le lien se diffuse ensuite : si un site très lié pointe vers un autre site, le lien qu'il créé aura plus de poids, ou d'importance, que s'il émanait d'un autre site, disposant de moins de "capital confiance". En parcourant le Web de lien à lien et de page à page, le GoogleBot, chargé de récupérer les pages, construit la toile et stocke le contenu textuel dans le cache de Google, pour analyse.

En analysant le contenu textuel des pages, les ordinateurs de Google tentent d'en extraire la substantifique moelle : des mots-clefs. Ces mots-clefs sont indexés dans une base de données monumentale, parcourue par la requête de l'utilisateur. L'ensemble du texte est trié et classé, sauf les mots trop courants. Cette phase est très importante, montre ici encore l'attachement de Google aux fondations du Web : un site purement textuel aura plus de chance d'être crédible et bien indexé, qu'un site équivalent entièrement réalisé en Flash, ou uniquement disponible en PDF.

La relation d'une recherche à une page se fait ensuite non seulement par le poids de la page et les mots-clefs qu'elle contient, mais également par son titre et la manière dont le site est lié. Il est en effet facile de montre que le texte décrivant un lien a sa part dans la recherche : une simple requête contenant "cliquez ici" donnera les pages de téléchargements de certains plugins très liés avec ce descriptif, même si les pages elles-mêmes ne contiennent pas les mots de la requête.

De la même manière, si les mots de la requête ou le titre de la page apparaissent dans l'URL - idéalement, séparés par des tirets plutôt qu'avec tous les mots liés, les chances pour cette page d'être bien placée sont plus fortes que si l'URL était d'une forme moins explicite (comme exemple.com/index.php?id=48 ou exemple.org/lmksdf45s1dg).

Enfin, tout comme les sources d'informations de la vie réelle (journaux, magazines...), Google prend en compte la fraîcheur d'une page, et son rythme de mise à jour. Ainsi, un site "vitrine" qui n'a pas changé depuis plusieurs mois aura toujours moins de poids pour Google qu'un site dynamique mis à jour régulièrement. C'est la raison pour laquelle les weblogs peuvent avoir un placement si élevé pour certaines requêtes, face aux sites légitimes mais plus rarement mis à jour des entreprises dont ils discutent.

S'ajoutent à cela certaines règles de bon sens, comme par exemple accorder plus de confiance aux noms de domaines déposé pour plusieurs années - car les sites de spam ne sont généralement enregistrés que pour une année -, ou la vitesse à laquelle un site se remplit de liens - si l'ajout est trop rapide, il s'agit probablement d'une ferme à liens, donc d'un spammeur. Ces règles sont changeantes dans leur importance, et de nouvelles peuvent apparaître aussi rapidement qu'elles disparaissent.

  Forum

Réagissez dans les forums de JDN Développeurs

Le PageRank d'un site, c'est-à-dire son poids dans l'index de Google, dépend donc non seulement de la qualité du contenu d'un site, mais aussi, par extension, de celle des sites qui le lient. Le PageRank correspond donc à un ensemble de vases communicants travaillant avec la crédibilité de chacun, de manière à former un cercle de confiance très large, et aussi éthique que possible.
 
Xavier Borderie, JDN Développeurs
 
Accueil | Haut de page
 
 





Quand achetez-vous le plus en ligne ?
Du lundi au vendredi
Le samedi
Le dimanche

Tous les sondages