IndexNow協議 搜尋索引從拉到推的演變!

2022-09-26 21:45:13 字數 3188 閱讀 1505

程式設計客棧(www.cppcns.com)訊息:為了發現眾多**上新發布的頁面,搜尋引擎往往需要www.cppcns.com爬行並渲染上萬個頁面,可能需要幾天到幾周的時間才能發現內容發生了變化,不過這一低效索引問題將有望得到解決。

去年 10 月份,微軟與俄羅斯搜尋引擎yandex一起推出了indexnow 的新爬蟲協議,目的是提高搜尋引擎爬蟲和索引的效率。

indexnow協議到底是什麼呢?

具體來說,indexnow是由 microsoft bing 和 yandex 建立的新協議,允許**在建立、更新或刪除其**內容時,通過使用api輕鬆通知搜尋引擎。

日前,微軟再度宣布,它正在通過確保提交的url在搜尋引擎之間共享,使該協議更容易實施。

這意味著**管理員只需要乙個api介面,所有的url將被共同分享給支援indexnow協議的所有搜尋引擎。除了為內容發布者節省時間和精力外,這www.cppcns.com還有助於搜尋引擎的內容發現工作,這使網路在整體上更有效率。

你或許已經覺得這個協議和百度的鏈結提交api很相似了。的確也是這樣,只不過內容提交後並不保證被爬行或收錄,搜尋引擎只是會「被通知到」這個變化,並且將這些url的爬行優先順序提公升到更高一些。

圖注:程式設計客棧已實現indexnow介面推送,推送成功後可以通過bing站長平台入口檢視到url

indexnow帶來了搜尋索引的演變

了解完indexnow協議,可以發現它非常重要,因為帶來了搜尋引擎發現更新和新發布網頁的方式的重大變化。

我們知道, 搜尋引擎獲取網頁資料有兩種方式:拉取和推送。拉取是指搜尋引擎爬蟲訪問**以請求網頁並從伺服器「拉取」資料。這就是搜尋引擎傳統上的工作方式。

而indexnow 所做的是將內容發現更改為推送方法,它使發布者受益於快速索引和更少的伺服器負載,因為機械人不需不斷地爬取他們的網頁。主要搜尋引擎的採用將是內容發布者和搜尋引擎之間關係的演變,這對雙方都有利。

利好內容發布者

對於內容發布者來說,它可以幫助減少對伺服器的爬取需求,搜尋引擎不需要進行探索性爬取來檢查網頁是否已更新,並且減少了發現和索引內容的時間。

另外,減少伺服器負載有助於伺服器以最佳方式執行,而不會增加搜尋引擎已經擁有的網頁冗餘服務的負擔。

最終,它也通過減少爬行和索引的能源需求,可以減少全球變暖壓力造福世界。

已有多個搜尋引擎參與,谷歌正在測試

最新資料顯示,indexnow協議已經被bing和yandex等多個搜尋引擎採用,並且超過 8 萬個**開始發布並收穫了更快提交索引的好處。

目前,已經採用indexnow協議的公司名單包括:

而讓更多人關心的是,未來谷歌是否也會採用indexnow協議。對此,谷歌發言人在去年 11 月份也發表宣告,確認谷歌將測試新的indexnow協議。這意味著indexnow的效能將大幅上公升。

另外,佔全球最大市場份額的cms wordpress也正在考慮支援indexnow協議。不過,目前他們似乎鼓勵外掛程式的開發,而不是急於將其整合到wordpress核心本身。可以說,wordpress仍處於觀望狀態,等待谷歌以及其它搜尋引擎等更廣泛的行業認同。

如何部署indexnow?

對於**管理者,只需要在**頁面發生變更時去通過這個協議ping一下搜尋引擎,搜尋引擎就會被成功通知到。

圖注:金鑰生成過程,頁面經過機器翻譯

如果你是開發人員,部署 indexnow具體可以遵循以下步驟:

1)使用**金鑰生成工具程式設計客棧生成協議支援的金鑰。

2)將金鑰託管在**根目錄的金鑰值命名的文字檔案中。

3)新增、更新或刪除 url 後開始提交 url。您可以為每個 api 呼叫提交乙個 url 或一組 url。

4)提交乙個 url 就像傳送乙個簡單的 http 請求一樣簡單,其中包含更改的 url 和您的金鑰,就像下面這樣:

ht有關實施的更多詳細資訊,可以訪問indexnow了解。

(**:

關於indexnow常見問題解答

搜尋引擎提交 url 的端點是什麼?

——啟用 indexnow 的搜尋引擎會立即共享提交給所有其他啟用 indexnow 的搜尋引擎的所有 url,因此您只需通知乙個端點。

提交了乙個 url會有什麼效果?

——如果搜尋引擎喜歡您提交的url內容,搜尋引擎將嘗試根據其爬取邏輯和**的配額對其進行爬取,以快速獲取最新內容。

一天內提交了一萬個url,會發生什麼?

——如果搜尋引擎喜歡這些url內容,並且站點有足夠的抓取配額,搜尋引擎將嘗試抓取部分或所有url。

已經提交 url,卻沒有被編入索引怎麼回事?

——使用 indexnow 可確保搜尋引擎了解您的**更新,但並不保證網頁會立即被搜尋引擎抓取或編入索引,可能需要過一段時間才能被索引。

剛開始使用indexnow,應該發布去年更改過的url嗎?

——不需要,只需要發布自您開始使用 indexnow以來發生變化(新增、更新或刪除)的 url。

提交的 url 是否計入抓取配額?

——會。每次抓取都計入**的抓取配額。

為什麼沒有看到所有提交的url被搜尋引擎索引?

——如果內容不符合搜尋引擎選擇標準,則可以選擇不抓取和索引 url。

網頁很少的小站點適合使用indexnow嗎?

——當然。如果您希望內容更改後立即讓搜尋引擎發現,那麼建議使用 indexnow。

可以每天多次提交同乙個 url 嗎?

——建議避免一天多次提交相同的 url。如果頁面經常編輯修改,那麼最好在兩次編輯之間等待 10 分鐘,然後再通知搜尋引擎。如果頁面不斷更新,最好不要每次更改都使用 indexnow。

可以通過 api 提交 404 **嗎?

——可以。可以提交死鏈(http 404、http 410)頁面來通ipddymx知搜尋引擎有關新的死鏈結。

可以提交新的重定向嗎?

——可以。可通過提交新重定向的 url(例如 301 重定向、302 重定向等)通知搜尋引擎內容已更改。

什麼時候需要更換金鑰?

——搜尋引擎在收到新金鑰時只會嘗試抓取 .txt 檔案一次以驗證所有權。此外,不需要經常修改金鑰。

每個主機可以使用多個金鑰嗎?

——可以。如果您的**使用不同的內容管理系統,每個內容管理系統都可以使用自己的金鑰;在主機的根目錄發布不同的金鑰檔案。

有sitemap還需要 indexnow嗎?

——是的。搜尋引擎訪問sitemap頻率也可能很低,使用 indexnow,可以讓**管理員「不必」等待搜尋引擎發現和抓取sitemap,直接通知搜尋引擎新內容。

---end---

本文位址:

lucene搜尋索引

官方demo,裡面思路也算清晰,也可以執行 lucene 6.3.0建立索引 public class searchfiles string index index string field contents string queries null int repeat 0 boolean raw ...

站內搜尋 索引 XML解析

看 看碼說話 string indexpath c index 索引庫 儲存位址 web.config可配性 fsdirectory directory fsdirectory.open new directoryinfo indexpath new nativefslockfactory 索引檔案...

Lucene搜尋 索引過程筆記

lucene索引文件過程 初始化indexwriter 構建document 呼叫indexwriter.adddocument執行寫入 初始化documentwriter。引數指定寫出位置為記憶體 生成自增段id 呼叫documentwriter.adddocument 執行寫入 寫出fieldi...