天刃在和很多站長朋友聊天時,大家經常會提到這樣的情況:對**某個頁面做了改動之後,百度的排名大降,有的甚至乾脆直接沒有了記錄(一些朋友稱之為的「被k」), 之後便不知也不敢對該頁面做任何改動了,但是幾天之後, 發現百度裡又重新出現了這個頁面,或是排名又「莫名其妙」的恢復了,大家對這個問題大惑不解;還有就是對於剛做的新站,經常看到一些朋友在落伍和站長網抱怨「為什麼百度還不收錄我的站?」,或是看到有的站長欣喜若狂的「我的站四天就被百度收錄了」,或是一些站長充滿疑惑的「怎麼百度今天才收錄的,而快照時間卻是乙個星期前呢?」等等問題,天刃今天就給大家簡單的解釋一下百度這些情況出現的原因。
以前就和大家討論過,百度索引和釋放之間有個時間差,對於新站的收錄這個現象最明顯,但是對於一些重視**優化的站長來說,某個關鍵詞排名跳動異常,甚至一些優化的不是很嚴重的頁面只是做了很小的改動之後便從百度裡消失了,提心吊膽幾日後卻又無緣無故的又出現了,對於這種情況用索引程式設計客棧和釋放的時間差來解釋,似乎有些不通。這樣,天刃用乙個天刃自己的概念:百度「觀察盒」,來給大家解釋一下這個現象。因為中國國情的特殊,網路**在一定情況下受到國家政策的約束,所以百度對新站採取的都是先審核再收錄的原則,根據**的型別(論壇、資訊發布或是什麼其他**)、**的定位(娛樂的,行業的,時政的)不同,審核的嚴格程度也不同,所以就會導致新站被百度收錄的時間沒有乙個標準。對於這些新站,百度有沒有乙個物理的歸類呢?這裡天刃告訴大家,有。至於應該叫什麼,我們這裡就暫且把它稱為百度「觀察盒」。對於新站,百度首先將索引到的內容放入「觀察盒」,審核通過後將其放出,納入到正常索引的位址庫中,所以有的朋友疑惑「為什麼今天百度才收錄,而快照的時間卻是乙個星期前的」就很好解釋了。對於某些**,或是某些頁面沒理由的被百度從結果裡刪除,而不久後程式設計客棧又恢復正常,就像今年6月初百度的大更新,一夜之間數萬**站長叫苦自己的**無緣無故被百度k了,而幾天之後大部分**又恢復了收錄,排名也基本沒有多大變動。準確的說,這是百度的一次大審核,將所有嫌疑比較大的**(**)全部列入到百度的「觀察盒」中,這樣很多**就在百度的搜尋結果中消失了,百度對這些**進行審核後,確實有作弊嫌疑或違法違規站的,直接k掉,對沒有嚴重作弊的**,又重新放回到正常**庫中。
除了這樣大規模的審核外,百度會將頁面優化細節明顯的網頁,以及內容修改頻繁的網頁放入「觀察盒」,確定該頁不存在作弊,百度便會將其放出正常按演算法排序,如果該頁有優化細節但不嚴重,便會被適當降權然後放出。
天刃的這個百度「觀察盒」叫法不一定合適,但其具體的工作模式應該沒有太大zadwbo出入。希望能為有上述疑問的站長朋友解開疑雲。
本文標題: 百度「觀察盒」原理分析
本文位址: /news/seo/65233.html
百度XSS Worm 分析
css expression css表示式 可以在css中定義表示式 公式 來達到建立元素間屬性之間的聯絡等作用,從ie5開始支援,最後因為標準 效能 安全性等問題,微軟從ie8 beta2 開始取消對 css expression的支援。也就是說可以在css 後面插入一段js css的屬性值為其後...
面試分析(百度)
這是別人面試的題目,我自己無聊嘗試完成下 1.給乙個函式,返回0和1,概率為p和 1 p 請你實現乙個函式,使得返回0和1概率一樣。分析 該問題在左騰雲的書上有講過,思路一般利用乘和加數學方式完成,該題共分母 p 1 p 回答 設f x 為0 p 1 1 p p f x 為0 p 1 1 p 1 p...
百度產品分析
我本身不是做網際網路的,但是是想做網際網路的。網際網路起來這麼多公司,我們做管理軟體的,十幾年如一日,盈利模式一點沒有變,和網際網路一點關係也沒有。所以,管理軟體廠商如何走入網際網路,是我一直關注的。所以也研究網際網路的盈利模式。關於寬頻網上的教育,我一直看好。不過中國人,大人不學習,硬逼著孩子學習...