Google PR值的詳細演算法

2021-06-28 15:11:16 字數 1575 閱讀 5383

假設乙個由4個頁面組成的小團體:a,b, c 和 d。如果所有頁面都鏈向a,那麼a的pr(pagerank)值將是b,c 及d的和。

pr(a) = pr(b) + pr(c) + pr(d)

繼續假設b也有鏈結到c,並且d也有鏈結到包括a的3個頁面。乙個頁面不能投票2次。所以b給每個頁面半票。以同樣的邏輯,d投出的票只有三分之一算到了a的pagerank 上。

pr(a) =pr(b) /2+pr(c) /1+pr(d)/3

換句話說,根據鏈處總數平分乙個頁面的pr值。

pr(a) =pr(b) /l(b)+pr(c) /l(c)+pr(d)/l(d)

最後,所有這些被換算為乙個百分比再乘上乙個係數q。由於下面的演算法,沒有頁面的pagerank會是0。所以,google通過數學系統給了每個頁面乙個最小值1−q。

pr(a) =(pr(b) /l(b)+pr(c)/l(c)+pr(d)/l(d)+...+pr(n)/l(n))q+1-q

所以乙個頁面的 pagerank 是由其他頁面的pagerank計算得到。google 不斷的重複計算每個頁面的pagerank。如果您給每個頁面乙個隨機 pagerank 值(非0),那麼經過不斷的重複計算,這些頁面的 pr值會趨向於正常和穩定。這就是搜尋引擎使用它的原因。

其中,pr(a):指網頁a的佩奇等級(pr值)

q:阻尼係數,介於0-1之間,google設為0.85.

從上面的公式我們可以看到網頁a的pr是由鏈結它的其他網頁l(n)所決定的。在網頁l(n)中如果有乙個鏈結指向網頁a,那麼a就得到了乙個「投票氣而這個投票來自網上任何一張網頁。每個「投票」都是表示乙份「支援」。越多的鏈結指向網頁a,網頁a的pr值或者等級就越高。沒有鏈結就是沒有乙個網頁支援a。

但是不同網頁的pr值不同,所以不同的網頁給網頁a的投票權重是不一樣的。

完整的pr值計算方法

這個方程式引入了隨機瀏覽的概念,即有人上網無聊隨機開啟一些頁面,點一些鏈結。乙個頁面的pagerank值也影響了它被隨機瀏覽的概率。為了便於理解,這裡假設上網者不斷點網頁上的鏈結,最終到了乙個沒有任何鏈出頁面的網頁,這時候上網者會隨機到另外的網頁開始瀏覽。

為了對那些有鏈出的頁面公平,q =0.15(q的指阻尼係數)的演算法被用到了所有頁面上,估算頁面可能被上網者放入書籤的概率。

所以,這個等式如下:

p1,p2,...,pn是被研究的頁面,m(pi)是鏈入pi頁面的數量,l(pj)是pj鏈出頁面的數量,而n是所有頁面的數量。

pagerank值是乙個特殊矩陣中的特徵向量。這個特徵向量為

r是等式的答案

如果pj不鏈向pi, 而且對每個j都成立時,等於 0

這項技術的主要缺點是舊的頁面等級會比新頁面高。因為即使是非常好的新頁面也不會有很多上游鏈結,除非它是某個站點的子站點。

這就是pagerank需要多項演算法結合的原因。google經常懲罰惡意提高pagerank的行為,至於其如何區分正常的鏈結交換和不正常的鏈結堆積仍然是商業機密。

但是我們始終堅持一點是,大家不要刻意的去追求pr值,因為影響排名的因素有上百種。建議**設計人員可以充分認識佩奇等級在google優化排名中的重要作用,從設計前的考慮到後期**更新都要考慮一下佩奇等級。從而很好的利用googlepagerank。

Google PR值原理和詳細解說

什麼是google網頁級別?通常我們所說的pr值就是google搜尋引擎評價 的核心因素全稱為pagerank,這是由google創始人開發出的一套用於網頁評級的系統,是google搜尋排名演算法中的乙個組成部分,級別從1 10級,10級為滿分,pr值越高說明該網頁在搜尋排名中的地位越重要,也就是說...

求圍圈問題的詳細演算法

我用三種不同的演算法來做的 求圍圈問題的詳細演算法和程式 n人圍成一圈,編號為1,2,3,17,從1開始報數,報到m的倍數的人離開,一直下去,直到最後剩下1人,求此人的編號 include include int main void for i 0 i n i i 0 從下標為 i n 的元素開始數...

求圍圈問題的詳細演算法

我用三種不同的演算法來做的 求圍圈問題的詳細演算法和程式 n人圍成一圈,編號為1,2,3,17,從1開始報數,報到m的倍數的人離開,一直下去,直到最後剩下1人,求此人的編號 include include int main void for i 0 i n i i 0 從下標為 i n 的元素開始數...