搜尋引擎是如何確定你的內容就是原創內容

2022-10-05 22:15:23 字數 2278 閱讀 3760

很多人在群裡聊到一些事情,比如原創是如何被搜尋引擎確定的?核桃今天分享一下自己對搜尋引擎確定原創內容的看法。

首先我們明確兩個概念:原創與偽原創

原創:簡單地理解就是第一次在網路上發表的內容。

偽原創:就是對原創進行的第二次或者第n次經過修改的**發表。比如修改標題,增加摘要,**不完整內容等等。

搜尋引擎對於原創的判斷是如何進行的呢?

一般來講有以下幾個方面的因素決定:

1、快照日期。

2、蜘蛛抓取日期。

3、頁面外鏈的多少。

4、文章修改的程度。

舉例:如果一篇標題為《搜尋引擎如何確定你的就是原創內容》的文章在今天10點第一次發表在乙個部落格或者**上。會有什麼結果呢?

搜尋引擎蜘蛛來到這個部落格或者**,發現這個頁面,分析內容,放入資料庫,並且被確定為首次發現,這肯定就是原創了!

那麼這個收錄與判斷的過程中間有幾個細節方面問題:

1、必要條件

——假如這個**沒有被收錄,這篇文章會認為是原創嗎?

——當然不是!因為它根本不可能出現在搜尋資料庫裡!

——如何讓它成為原創內容?

——第乙個條件,**必須有被搜尋引擎收錄。

——假如這個**收錄了,但是不經常更新呢?

——很簡單,如果不經常更新,發表的文章到收錄的時候也會認為是原創的。

3、**與採集

——如果文章被**了呢?

——如果文章被**,那麼看**這篇文章的站更新週期與首次發表站的更新週期哪個更快。

——不太www.cppcns.com明白更新週期。

——比如在a站發表,b站**,如果蜘蛛先訪問了a站,發現了文章,再來到b站發現了文章,很明顯的,原創權重歸a站。

——採集的情況是否符合這種情況?

——是的,採集的情況一樣。如果b採集a,但b收錄比a早,b就可能變成原創嘍!

4、訪問時間

——如果蜘蛛先訪問了b站呢?

——當然權重給b站,一般的情況下都會這樣!

——如果b站**的文章帶了a站的原文章頁面鏈結呢?

——這就很明白了,剛收錄的時候,如果排名,兩條結果一起出現,有可能還是b站的排名好一點。

當然,文章**次數多了以後,a站的鏈結越多,對a站的文章越有好處,排名會慢慢變成a站在前面。

——如果另外**的文章帶的是b站頁面的程式設計客棧鏈結呢?

——這種情況就搞笑了,給搜尋引擎開了個玩笑,但它們如果判斷不好,就變成了乙個鏈結流行度的比賽了。

不過,如果都有很多外部鏈結,並且相差不大,那麼判斷的規則應該回到原點,誰先被收錄誰就是原創。

5、快照日期

——快照日期顯示時間最早的,一般就是原創了吧!

——不一定,這個說法要在乙個更新週期之內,比如說文章發表後一周內,快照時間越早的位址將越有被認可為原創的可能。

但如果文章都發表了幾個月了,說不定搜尋引擎已經重新獲取過快照了,快照的日期就變了!

——還有其它的可能嗎?

——有,一般比如百度收錄,他可能會有乙個收錄的資料庫,經過過濾後,收錄的內容才會到搜尋結果裡來。在這個期間就有一些問題了,比如a站首次發表,b站hacbqehleq**。蜘蛛先訪問a站再訪問b站。而後可能先把b站的結果放出來了,而a站還在資料庫裡。

所以說搜尋引擎沒有收錄並不表示搜尋引擎蜘蛛沒有訪問過這些內容,也許在搜尋引擎的庫存裡已經有記錄了,只是你查的時間沒有放出來而已,就像25號才放出來的內容,但是快照是20號的,這就是搜尋引擎的庫存內容,同時這也是檢驗原創的核心時間點。

這種情況一般出現在新站與老站之間,a站發表,b站**,但a站在搜尋引擎的信任度並不高的時候。不過只要是a站先被訪問到的,原創權還是a站的,這是最難分出來的情況,因為我們不知道蜘蛛先訪問哪個站,除非你知道兩個站的**空間日誌內容,能看到搜尋引擎對兩個頁面的訪問時間。

6、偽原創

——偽原創也會被認為是原創?

——大多時候是這樣的,搜尋引擎蜘蛛智力相當於三歲小孩子一樣,不能明確分別這些東西,因為它的思維太程式化了。如果你的標題改過,文章的段落改過,那麼蜘蛛將很難確定這篇文章是否有過收錄,也許它www.cppcns.com可以確定有部分內容是重複的,但它也不能因為這些而將這篇文章確認為是**!當然,隨著搜尋引擎程式設計的提高,應該會有乙個相似度的東西出來,比如文字內容相似度超過百分之幾就會被認為是**。

這樣分析下來,相信大家應該了解了吧。只是核桃自己的看法,希望大家吸收自己想要的東西,不認同的了也來提下自己的意見!

另外提幾個建議:

1、如果你的站是新站,權重不高,如何讓蜘蛛首頁找到你的頁面並放入資料庫?其實很簡單:用網摘、百度這些工具讓蜘蛛更快的找到你的頁面!

本文標題: 搜尋引擎是如何確定你的內容就是原創內容

本文位址:

搜尋引擎是如何評估網頁內容優劣的

雖然搜尋引擎現在越來越趨向於智慧型化的發展,越來越懂得搜尋者究竟想要的是什麼,但它終究還是一台機器,而任何機器都是要遵循一定的演算法比較,才能得出結果,那麼搜尋引擎是通過哪些判斷來確定數萬億網頁資料的關係和相關度匹配的呢?web網路的網頁資料是非常龐大的,搜尋引擎雖然不能乙個乙個的去計算每乙個網頁,...

搜尋引擎是如何工作的

當我們在搜尋引擎上鍵入片語進行搜尋時可能並沒有想過,它是如何把我們想要的資料在那麼短的時間內找出來。事實上幾乎所有的搜尋引擎都會有下列的功能以保證它能夠又好又快的為我們提供資料。1,爬行整個web crawling web 搜尋引擎自動執行的程式通過web的超級鏈結 hyperlink 結構爬行整個...

搜尋引擎的原理就是你搜尋資訊的習慣

做搜尋引擎憂化的可以由三個字母代替 seo,洒家也好這一杯,也看了不少文章,但大多文章講的內程式設計客棧容都差不多,更有些牛人指點江山,激昂文字,好像baidu,google都是他們編的一樣。一時半會兒關於seo,這個聖經,那個寶典的層出不窮,只要標題有這些詞兒我會毫不吝嗇的送上他們乙個pv,看過之...