SEO優化技術基礎理論及基本概念的認知

2022-09-24 07:57:12 字數 2873 閱讀 6218

如何設定seo關鍵詞當然重要,但seo優化技術如果只是機械式的說該做什麼不做什麼,而涉及的步驟又非常死板,例如:將焦點關鍵詞設定放在標題一,關鍵詞在首段重複出現三次等等 ,會是何等枯燥乏味。

過去二十年搜尋引擎優化是圍繞關鍵詞為基礎,理由是計算機無法有效分析自然語言輸入,從而理解搜尋使用者的目的,退而求其次依賴搜尋使用者輸入簡單片語作為導向,就是所謂關鍵詞。關鍵詞研究 keyword research 是指利用工具,例如 :google adwords planner 分析個別關鍵字的搜尋量和競爭度。由於傳統搜尋引擎優化是以關鍵字為物件,關鍵字研究得出來的一籃子關鍵字會根據和內容的相關性被分配到**內不同網頁用作所瞄準的關鍵字。

seo關鍵字 – 基本概念

多了解一些關鍵字設定基本概念和基礎理論會令seo優化變得更有趣味。例如:seo關鍵字的出現密度的基礎理論是tf-idf。搜尋引擎希望從頁面出現的關鍵字密度決定該seo關鍵字和內容的相關性 relevance 有多大。用淺白語言排除數學其實不難理解:

關鍵字在網頁出現的頻率就是 tf (term frequency)。如果關鍵字 k 在網頁出現 4 次, tf 值看似應該是4。

問題是如果a頁的內容長度是 b頁的兩倍,某關鍵字 k 在a頁的出現次數是b頁兩倍時就不能斷言關鍵字 k 與a頁更相關。所以 tf 被修正為 出現次數 / 長度。例如,出現 4 次檔案章度為 100 個字:

tf 值 = 4 / 100 = 0.04

問題是例如一編介紹 「網上生意」 文章的描述中,有些字像 「客戶」,」網上」 的 tf 就顯然要比 「網上生意」 的 tf 為高。但說該文章跟 「網上」 或 「生意」 的相關性較 「網上生意」 為高,明顯違反常識。當文章是談論 「網上生意」,」雲端運算」,」網上繳費」,」網上教學」等等時 「網上」 都很可能被提及。結論是 「網上」 一詞是一般文章中更普及出現。單純利用 tf 計算相關性會出現以上的偏差。

解決的方法是對愈普及的關鍵字給www.cppcns.com出愈低的權重 weight,倒如在 10,000 文章中關鍵字 「網上」 出現 100 次,權重變成倒數 (所以叫 idf 或 inverse document frequency) 10,000/100 = 100 , 如關鍵字 「網上推廣」 在 10,000 文章**現一次,權重變成 10,000/1 = 10,000. 為了令這權重值變化不要不急,所以以 log base 10 計算。

「網上」 idf 值 = log (10,000 / 100) = 2

「網上推廣」 idf 值 = log (10,000 / 1) = 5

將 tf 乘以 idf 就是相關性的評分。當然今天的搜尋引擎採用的 tf-idf 更複雜,但原理是一樣。今天搜尋引擎已經進化到非常複雜,除了 google 內部從事 seo 研究的資深工程師外,外面從事seo優化的人只能根據一些如專利申請和google人員不同埸合的闡述等符嘗試理解其中的精萃。google 搜尋引擎計算關鍵字相關性的演算法是以 tf-idf 為基礎,但已經進化到更為先進。

長尾關鍵字

長尾關鍵字 long tail keyword 指基於通用關鍵字在前或在後或同時在前後加入更多字眼作更精準標示所要找的產品、服務或資訊,長尾關鍵字 idf 值高。例如:「大碼衣服婚禮用」,「防敏感化妝品」等等。長尾關鍵字特色是搜尋量小,但同時提供和該關鍵字相關的產品、服務或資訊的**亦小,所以該長尾關鍵字的搜尋排名競爭亦小,更容易獲得高搜尋排名。

焦點關鍵字

焦點關鍵字 focus keyword 指網頁內容是以該關鍵字為爭取排名目標,焦點關鍵字 idf 值低。所以在頁內重要的元素中會加入該焦點關鍵字以便通知搜尋引擎網頁內容和焦點關鍵程式設計客棧字的相關性。seo 優化工具如 yoast seo, seopressor 的排名優化建議都需要先設定焦點關鍵字。一般網頁內容只應瞄準一兩個焦點關鍵字,否則可能造成文理不通,降低可讀性。

單頁相關還是多頁相關

某些**接受遊客發帖 guest posting, 單獨乙個頁面和某關鍵字有高相關性不及和好幾頁面展現高相關性來得重要。利用 itf 可以偵測到整個** (或者更正確是整個**中被搜尋引擎索引的頁面) 和某關鍵字的相關性。例如「南韓時裝」 在一般**的 itf 是 0.0003,即是在一萬頁中只有 3 頁提及,而某**是 0.05,即一百頁中有五頁提及,就表示該**以 「南韓時裝」 為主題的可能性極高。也就是該**對 「南韓時裝」 的權威性高,亦即是 google rater guideline 所闡述優質內容 e.a.t 裡內的 a,代表 authority。搜尋引擎是偏好來自權威性高的內容。

直接相關還是間接相關

關鍵字有同義詞 synonyms。例如:教員,教師,老師代表非常接近甚至完全相同的概念或事物。當網頁或**和關鍵字a的相關性高,而關鍵字b是關鍵字a的同義詞時,就間接引證該網頁或**和關鍵字b的相關性亦高。但由於是間接相關,所以網頁對搜尋輸入關鍵字b的排名評分會略低於對直接相關的關鍵字a。

應該是直接相關還是間接相關取決於地理位置文化差異。有些同義詞是由於文化地理差異引起,例如 「moggie」 是英國人對混種家貓的稱呼,亦就是一般我們都叫 「cat」. 隨著手機普及可以更準確判斷使用者的地理位置,英國使用者輸入 「moggie」 可以判斷為貓 (搜尋引擎很可能判斷與 「cat」 為直接相關),但中國使用者輸入 「moggie」 就不一定 (搜尋引擎很可能判斷與 「cat」 為間接相關)。

關鍵字的繁簡轉換亦可以看成間接相關,所以你會看到輸入繁體關鍵字時亦有時會出現簡體排名結果。但亦是由於間接相關,所以排名計分稍為不利。

潛在詞義的相關性

隨著手機愈趨普及,語音搜尋 voice search 使用量會大幅增加。當使用者慢慢發現原來搜尋引擎對自然語音輸入的理解原來不差時,搜尋使用者行為亦會改變,放棄以片語式關鍵字輸入而改為更自然的句子。rankbrain 的出現就是為了處理更複雜的詞意含義,通過利用人工智慧 ai 理解潛在含意而將使用者的搜程式設計客棧索輸入和隱含的關鍵字搭出關係。例如使用者查詢:pdf 有什麼弊端,通過 rankbrain 潛在詞義分析轉化為 「pdf 保安」。

lsi 和 proximity

基礎理論(四)

1.簡述python中物件的記憶體是如何管理的 2.簡述類和物件的概念及類繼承的特點 3.簡述python如何操作 mysql,用到什麼包 寫出具體的增刪改查語句 4.簡述scrapy爬蟲的資料流向過程 5.網路七層協議都是哪七層?6.scrapy中如何設定隨機請求頭 隨機 寫出具體步驟 需要什麼配...

vue基礎理論

2 前端框架與庫的區別?kfc的世界裡,庫就是乙個小 框架就是全家桶 上的不同 3 vue起步 vue的檔案介紹 4 插值表示式 注意 必能直接寫語句 可以用於頁面中簡單粗暴的除錯 注意 必須在data這個函式中返回的物件中宣告 比如在angular中 以ng 開頭的就叫做指令 在vue中 以v 開...

lvs基礎理論

一 lvs的型別 1 lvs nat network address translation 請求 client cip,vip director cip,vip 轉化director dip,rip real server dip,rip 響應 real server rip,dip direct...