|
|
TUTORIEL ALGO/METHODES |
|
|
|
Expliquez-moi... le PageRank Google |
Quels sont les différents critères pris en compte par le célèbre moteur de recherche pour classer les sites Web ? Comprendre pour mieux être référencé.
(12/12/2005) |
|
Si les algorithmes internes
de Google sont secrets et complexes, il est possible de
discerner certains comportements, et en les prenant en compte,
d'assurer une meilleure visibilité à ses pages Web. Voici quelques exemples.
La base fondamentale du fonctionnement de Google est le lien,
tant entrant que sortant. À partir du nombre de liens pointant vers un site ou une page,
Google peut établir l'importance de la cible, et donc lui accorder
une certaine confiance. Plus un site sera lié, plus il sera
considéré comme une référence, et sera donc mis en valeur par
rapport à d'autres.
Cette confiance
que créé le lien se diffuse ensuite : si un site très lié
pointe vers un autre site, le lien qu'il créé aura plus de poids,
ou d'importance, que s'il émanait d'un autre site, disposant
de moins de "capital confiance". En parcourant le Web de lien
à lien et de page à page, le GoogleBot, chargé de récupérer
les pages, construit la toile et stocke le contenu textuel dans
le cache de Google, pour analyse.
En analysant le contenu textuel des pages, les ordinateurs de
Google tentent d'en extraire la substantifique moelle : des
mots-clefs. Ces mots-clefs sont indexés dans une base de données
monumentale, parcourue par la requête de l'utilisateur. L'ensemble
du texte est trié et classé, sauf les mots trop courants. Cette
phase est très importante, montre ici encore l'attachement de
Google aux fondations du Web : un site purement textuel aura
plus de chance d'être crédible et bien indexé, qu'un site équivalent
entièrement réalisé en Flash, ou uniquement disponible en PDF.
La relation d'une recherche à une page se fait ensuite non seulement
par le poids de la page et les mots-clefs qu'elle contient,
mais également par son titre et la manière dont le site est
lié. Il est en effet facile de montre que le texte décrivant
un lien a sa part dans la recherche : une simple requête contenant
"cliquez ici" donnera les pages de téléchargements de certains
plugins très liés avec ce descriptif, même si les pages elles-mêmes
ne contiennent pas les mots de la requête.
De la même manière, si les mots de la requête ou le titre de
la page apparaissent dans l'URL - idéalement, séparés par des
tirets plutôt qu'avec tous les mots liés, les chances pour cette
page d'être bien placée sont plus fortes que si l'URL était
d'une forme moins explicite (comme exemple.com/index.php?id=48
ou exemple.org/lmksdf45s1dg).
Enfin, tout comme les sources d'informations de la vie réelle
(journaux, magazines...), Google prend en compte la fraîcheur
d'une page, et son rythme de mise à jour. Ainsi, un site "vitrine"
qui n'a pas changé depuis plusieurs mois aura
toujours moins de poids pour Google qu'un site dynamique mis
à jour régulièrement. C'est la raison pour laquelle les weblogs
peuvent avoir un placement si élevé pour certaines requêtes,
face aux sites légitimes mais plus rarement mis à jour des entreprises
dont ils discutent.
S'ajoutent à cela certaines règles de bon sens, comme par exemple
accorder plus de confiance aux noms de domaines déposé pour
plusieurs années - car les sites de spam ne sont généralement
enregistrés que pour une année -, ou la vitesse à laquelle un
site se remplit de liens - si l'ajout est trop rapide, il s'agit
probablement d'une ferme à liens, donc d'un spammeur. Ces règles
sont changeantes dans leur importance, et de nouvelles peuvent
apparaître aussi rapidement qu'elles disparaissent.
|
Forum |
|
Réagissez
dans les forums
de JDN Développeurs
|
Le PageRank d'un site, c'est-à-dire son poids dans l'index de
Google, dépend donc non seulement de la qualité du contenu d'un
site, mais aussi, par extension, de celle des sites qui le lient.
Le PageRank correspond donc à un ensemble de vases communicants
travaillant avec la crédibilité de chacun, de manière à former
un cercle de confiance très large, et aussi éthique que possible. |
|
|