搜尋引擎的工作分為三個節點,即爬行,索引,和檢索
1、爬行2、索引
此階段,爬網程式會建立搜尋引擎的索引。索引就像一本巨大的書,其中包含爬蟲找到的每個網頁的副本。如果任何網頁發生更改,則抓取工具會使用新內容更新圖書。
3、檢索
這是搜尋引擎以特定順序提供最有用和最相關答案的最後階段
全稱:search english optimization,搜尋引擎優化,即為了提公升網頁在搜尋引擎自然搜尋結果中的收錄數量以及排序位置而做的優化。
1、seo 的分類
2、白帽seo 的使用
在**上合理設定robot.txt 檔案;
通過**的結構布局設計和網頁**優化,使前端頁面既能讓瀏覽器使用者能夠看懂,也能讓「蜘蛛」看懂
1、**結構布局優化
控制首頁鏈結數量扁平話的目錄層次
盡量讓「蜘蛛」只跳轉3次,就能到達**內的任何乙個頁面
導航優化
導航應該盡量採用文字方式,也可以搭配導航,但 標籤務必新增 alt 和 title 屬性,告訴搜尋引擎導航的定位
src=""
alt="
" title="
">
其次,在每乙個網頁上應該加上麵包屑導航
對使用者而言,可以讓使用者了解當前所處的位置,形成更好的位置感,並方便使用者操作;
對蜘蛛而言,能夠清楚的了解**結構,同時還增加了大量的內部鏈結,方便抓取,降低跳出率。
結構布局的規範優化控制頁面的大小
乙個頁面最好不要超過100k,太大,頁面載入速度慢,使用者體驗不好,並且一旦超時,「蜘蛛」也會離開
2、網頁**優化
(1) title
標題,強調重點即可,盡量做到每個頁面的
標題內容不重複
>
>
name
="keywords"
content
=>
name
="description"
content
="英雄聯盟官方**,海量風格各異的英雄,豐富、便捷的物品合成系統,遊戲內建的匹配、排行和競技系統,獨創的「召喚師」系統及技能、符文、天賦等系統組合,必將帶你進入乙個嶄新而又豐富多彩的遊戲世界。"
>
(4) 標籤語義化
比如:h1-h6是用於標題類的,
>
標籤是用來設定頁面主導航的等
(5) a 標籤
頁內鏈結,要加「title」 屬性加以說明,讓訪客和 「蜘蛛」 知道;
(6) 正文標題要用 h1 標籤:
「蜘蛛」 認為它最重要,
的預設樣式可以通過css設定
(7) br
>
第一行文字
/>
第二行文字
/>
第三行文字
p>
(8) caption
**應該使用
>
**標題標籤
(9) img 應使用 「alt」 屬性加以說明
(10) strong 和 em : 需要強調時使用
>
>
而
>
、>
標籤: 只是用於顯示效果時使用,在 seo 中不起效果
空格符 應用 css 進行設定
(12) 少用 iframe 框架,因為「蜘蛛」一般不會讀取其中的內容
(13) 少用 display: none;
對於不想顯示的文字內容,應當設定 z-index 或設定到瀏覽器顯示器之外。因為搜尋引擎會過濾掉 display:none 中的內容
原文連線
搜尋引擎工作原理
搜尋引擎優化的主要任務之一就是提高 的搜尋引擎友好性,因此,搜尋引擎優化的每乙個環節都會與搜尋引擎工作流程存在必然的聯絡,研究搜尋引擎優化實際上就是對搜尋引擎工作過程進行逆向推理。因此,學習搜尋引擎優化應該從了解搜尋引擎的工作原理開始。搜尋引擎的主要工作包括 頁面收錄 頁面分析 頁面排序 及 關鍵字...
搜尋引擎工作原理
搜尋引擎工作原理 爬行和抓取 預處理 排名 爬行和抓取 1,是通過蛛蛛程式來實現的,蛛蛛主要是通過鏈結來抓取所有頁面的.所以要想讓蛛蛛盡量的抓取頁面,必須要吸引蛛蛛 優化 2,為了避免重複爬行和抓取 搜尋引擎建立了乙個位址庫用來儲存已經抓取的頁面 位址庫中的url 大多數是蛛蛛獲取到的,當然也有一些...
搜尋引擎工作原理
你剛才在 上買了一件東西 在首頁搜尋框中輸入 毛衣 二字並按回車鍵,這時你又產生了乙個pv,然後,網的主搜尋系統便開始為你服務,它首先對你輸入的內容基於乙個分詞庫進行分詞操作。眾所周知,英文是以詞為單位的,詞和詞之間靠空格隔開,而中文是以字為單位,句子中所有的字連起來才能描述乙個意思。例如,英文句子...