同樣的一本搜尋引擎原理書籍,不同的人可能有不同的理解程度,而且一些以前的seo理論雖然已經根深蒂固了,但是在目前的seo情況下已經不太實用了,比如乙個收錄問題。其實想準確了解索引、收錄、site這些之間的關係,我們可以從基本的原理出發去考慮一些問題。
從搜尋原理上講,蜘蛛先抓取到乙個網頁的url,然後對這個url對應網頁的內容進行**、分析,對於符合其質量標準或有一定用途的網頁進行索引,把索引後的網頁放入索引資料庫中。這時候索引庫內的網頁有些具有使用者檢索價值的,有些是具有搜尋引擎自身的檢索價值的,對於對使用者有檢索價值的被索引的網頁,會進行輸出,也即是我們說的收錄。而對僅僅有搜尋引擎自身檢索價值的網頁可能並不輸出,僅僅有一定的索引量而沒有輸出結果數,因此我們可以看到很多時候收錄量會比索引量低很多。
站在搜尋的角度而言,乙個**的網頁數量有時候是大於目前所擁有的網頁數量的。舉例來講,比如乙個站有100個網頁,對於使用者或者站長而言,是100個網頁,但是這100個網頁可能進行了資料更新,網頁改變等多個操作,不同版本或許能滿足不同的需求,(因此我們也可以看到www.cppcns.com很多時候乙個網頁有不同的快照。)從這個角度而言,在搜尋的眼中乙個**的網頁數量是可以大於**目前所擁有的輸出網頁數量的,特別對於頻繁修改的**或者url不規範的站點。同時,站在搜尋引擎的資料角度而言,其資料量可能由歷史資料和更新資料等組成的,因此site相關結果值也大於site結果數。
依據上面的說法,我們把四者的關係重新梳理下:
索引量和收錄量:索引量是所有對搜素有價值頁面的集合,這些頁面有些對使用者有價值,把這些頁面輸出出來就是收錄量(不同的人可能定義不一樣),有些頁面僅僅對搜尋引擎自身有價值,這些頁面數量就造成了索引量高於收錄量的數值。
site結果數與相關結果值:我www.cppcns.com們很多時候會看到site結果一般如下圖:
我們看到乙個問題,相關結果數為215,而site結果僅僅為40左右,兩者差距甚大。造成期差距的原因可能是有多個程式設計客棧因素造成的,比如有些網頁可能被重複計算了,有些網頁雖然被收錄了(檢索價值是有的)但是頁面質量不高(網頁價值和檢索價值不是一碼事,網頁檢索價值僅僅是網頁價值的乙個基礎而已,而網頁價值是多個因素組成的。)
同時我們也要知道,蜘蛛畢竟是機器,而且網際網路上很多**的網頁數量在不同地進行著變化,一直有新的網頁產生和老網頁的刪除,我們某個時候看到的值是乙個大體準確的值,而並不是100%準確的。
從包含關係而言,這四者的關係大體如下:
真實的搜尋引擎收錄量
你的 被google收錄了多少?這個問題一直圍繞著所有seor,我們通常會這樣做site com來檢視自己 的收錄量。恩,看起來這個數字不錯。但是當我們一周後重新site一下你會發現怎麼降低了,而且這段時間我什麼都沒有做啊!有時更加離譜的是我重新整理了一次,這個數字就變了!oh mygod!img ...
百度統計中索引量與site命令查詢數差異較大的原因
1 多數 出現索引量資料與site查詢結果數差異較大的情況 2 分析sem學院 的一些資料 2 site指令查詢的sem學院的收錄數 3 索引量資料與site查詢結果數差異較大原因 3 如果索引量資料與site查詢結果數差異較大,一般是新站。如果是站的時間比較長,那就是 被降權了。4 針對新站,如果...
收錄量和索引量到底有什麼區別
很多站長每天開啟電腦的第一件事就是檢視自己 的資料,一般比較關注的就是收錄量權重或者預計流量等這些基本問題。但是除了收錄量意外我們還比較關注的就是索引量,很多站長其實並不知道收錄量和索引量到底有什麼區別,甚至有些站長認為收錄量和索引量是兩個一樣的數值。關於這點我們可以用下面一張圖來解釋清楚 1,收錄...