Qu’est-ce que le PageRank ?
Le PageRank est un algorithme qui vise à trier des documents (des URL) par ordre d’importance.
Le PageRank a été développé à l'université de Stanford en 1996 par les cofondateurs de Google, Larry Page (d’où il tire son nom) et Sergey Brin dans le cadre d’un projet de recherche de ses inventeurs pour améliorer la recherche d'informations sur le web. Ils se sont inspirés du modèle de citation utilisé dans les publications scientifiques pour concevoir cet algorithme.
Dans le milieu académique, l'importance d'une publication est souvent déterminée par le nombre de citations qu'elle reçoit d'autres articles. De même, dans le cadre du PageRank, l'idée était que les pages web les plus citées étaient les plus pertinentes et donc méritaient d'être mieux classées dans les résultats de recherche. Chaque lien entrant (backlink) est donc vu par Google comme une citation ou un vote de confiance.
Ce concept a été présenté pour la première fois dans le document intitulé "The Anatomy of a Large-Scale Hypertextual Web Search Engine" publié en 1998. Cette publication est souvent citée comme l'une des contributions les plus significatives au développement des moteurs de recherche modernes, car elle a introduit une méthode innovante pour organiser et hiérarchiser l'information sur le web en s'appuyant sur la popularité des pages mesurée par leurs interconnexions.
Comment fonctionne le PageRank ?
Principe de base
Le PageRank attribue une valeur numérique à chaque page web en fonction de la quantité et de la qualité des liens qui pointent vers elle. Pour faire simple : plus une page reçoit de liens de pages elles-mêmes bien notées, plus son PageRank augmente.
Formule de calcul du PageRank
L'algorithme du PageRank peut être représenté par une équation qui prend en compte les liens entrants (backlinks) et sortants (outlinks) d'une page. L'idée est que chaque lien entrant est considéré comme un "vote" pour la qualité ou l'importance de la page. Cependant, tous les votes ne sont pas égaux ; un lien provenant d'une page avec un PageRank élevé aura plus de poids qu'un lien d'une page avec un faible PageRank.
La formule générale est :PR(A)=(1−d)+d×∑(PR(T1)C(T1)+PR(T2)C(T2)+⋯+PR(Tn)C(Tn))PR(A) = (1-d) + d \times \sum \left(\frac{PR(T1)}{C(T1)} + \frac{PR(T2)}{C(T2)} + \dots + \frac{PR(Tn)}{C(Tn)}\right)PR(A)=(1−d)+d×∑(C(T1)PR(T1)+C(T2)PR(T2)+⋯+C(Tn)PR(Tn))
- PR(A)PR(A)PR(A) est le PageRank de la page A
- ddd est un facteur de "damping" (généralement fixé à 0.85)
- T1,T2,…,TnT1, T2, \dots, TnT1,T2,…,Tn sont les pages pointant vers A
- C(Tn)C(Tn)C(Tn) est le nombre de liens sortants de la page TnTnTn
- FLAG_5a5h4i5th3b357
L'importance du PageRank pour le SEO
Le PageRank a toujours joué un rôle majeur dans le classement des pages dans les résultats de recherche de Google (SERP). Un PageRank élevé peut aider une page à mieux se positionner, bien que ce ne soit que l'un des nombreux facteurs pris en compte par l'algorithme de Google aujourd'hui.
Il est communément admis par les SEO que le PageRank est l’un si ce n’est le facteur qui joue le plus sur le positionnement des URL dans Google, mais cette affirmation peut largement être débattue.
Évolution du PageRank
Bien que le PageRank reste un concept clé, son importance relative dans les algorithmes de recherche de Google a diminué au fil du temps, au profit d'autres signaux de pertinence.
Google, dans une volonté à peine voilée d’éviter les abus, a également cessé de rendre public le PageRank des pages en 2016, bien que l'algorithme soit toujours utilisé en interne dans une version déclinée de l’algorithme originel.
Discussions