文章是否原創,搜尋引擎應該程式設計客棧也沒法從技術上作出絕對正確的判斷,甚至大致正確的也不能,無數的站長辛辛苦苦原創的文章經常排在許多垃圾部落格的**甚至是採集之後。到目前為止,本人認為搜尋引擎判斷文章是否原創的標準已經運用的有以下幾點:文章收錄時間、**上的鏈結、**的權重。
文章收錄時間:你的文章是十年前就收錄了,我的一篇一模一樣的文章十年後才收錄,當然你的文章是原創的了。但是如果收錄時間距離較短的話就難以判斷了,因為權重高的部落格收錄更快,我的文章五天前就發表了結果一直不收錄,結果你**了我的文章幾分鐘後就收錄了,如果搜尋引擎認為你的文章是原創的而我的是抄襲的,那我豈不是太冤了嗎?
**上的鏈結:這個應該是判斷原創標準最主要的一點了吧。如果你的文章結尾有一句:文章**於某某seo部落格,或者**中某些關鍵詞上有鏈向該關鍵詞的鏈結,那麼判斷你的文章是**該部落格的應該會比較準的。因為如果你鏈向了該文章的頁面判斷還是比較準的,如果鏈向該站網域名稱的話判斷還是很難的。總不能你文章鏈向了他的部落格結果他**你的文章都被搜尋引擎認為是原創吧?
**的權重:這個做seo的人應該更能理解一點。搜尋引擎認為乙個高權重、高pr的部落格文章原創的可能性更大一些。
其實還有乙個標準可以判斷文章是否原創,即檢視網頁的創程式設計客棧建時間。例如你的文章是頁面是去年建立的,我的是今年才建立的,並且文章內容一模一樣,那麼十有**我是**你的。如果還不能理解的話,就想想一下我們常用的 word、excel吧,是不是經常看到他們的最後修改時間呢?我們還經常用修改時間進行排列呢。相信這個記錄修改時間的技術對百度和谷歌來說絕對不是問題,這個技術性問題應該隨便乙個程式設計師都可以解決的吧?不知道現在百度和谷歌有沒有利用這種技術。當然這個技術也是有缺陷的,就是如果我的文章是原創的那麼我可能會經常改動,那麼我的文章的最後一次修改時間可能要比**我的文章要晚,這個搜尋引擎可以記錄同一文章的所有修改時間來解決,這個技術上也很容易實現。但是這又遇到了兩個問題:第
一、這意味著多大的工作量?百度、谷歌索引的可不是一台電腦上的東西,也不是乙個**的東西,而是數千億的頁面,記錄每次頁面的修改時間不知道在工作量和搜尋引擎伺服器反應能力上意味著怎樣的壓力;另一方面即使判斷出那個頁面kxrnb時最先建立的了,但是如果站長把最先建立的頁面原內容刪除替換成**別人的文章,這又該咋判斷啊?
寫了這麼多,大家可看到了每種判斷方式各有優缺點 ,搜尋引擎應該也特別希望能做出正確的判斷,不過先不說技術問題,光是判斷標準就夠令人抓狂的了。畢竟搜尋引擎只能根據人的命令才執行,如果我們無法給出絕對正確的判斷標準,那麼搜尋引擎也是沒法解決這個問題的……
本文位址: /news/seo/70158.html
搜尋引擎眼中的原創文章
一 什麼是原創文章 原創文章指的就是在搜尋引擎資料庫中沒有出現過的文章,搜尋引擎喜歡原創內容,但是你要了解,搜尋引擎喜歡的是優質的原創內容,而不是你隨便嘮叨二句的原創就是優質原創,有很多站長就死在 原創 二字上,死死的認為 需要的是純原創,從一開始就是自己寫文章,結果是越寫越沒得寫,越寫越差,最後也...
如何使用搜尋引擎
搜尋引擎的高階技巧 大多數搜尋引擎,除了直接搜尋關鍵字,都還會提供一些高階功能,常用的包括 示例 在搜尋框中搜尋 python site 就可以把搜尋結果限定在知乎內。對於一些沒有站內搜尋或站內搜尋不好的 來說很有用。示例 在搜尋框中搜尋 matching query does not exist ...
相關文章 中文搜尋引擎
1.為什麼需要搜尋引擎?什麼叫搜尋引擎呢?internet是乙個巨大的資訊資源寶庫,幾乎所有的internet使用者都希望寶庫中的資源越來越豐富,使之應有盡有。每天都有新的主機被連線到internet上,每天都有新的資訊資源被增加到internet中,使internet中的資訊以驚人的速度增長。然而...