穿插作弊是搜尋引擎antispam極為頭疼的問題

2021-05-23 13:21:24 字數 721 閱讀 3166

今天搜尋發現的case,很典型,所以記錄在下面:

穿插作弊,將作弊文字插入正常文字中,以欺騙搜尋引擎

採用這種作弊手段的網頁,通常spam的目標是偏長尾的query,

對於這些query,超鏈(pagerank)通常起得作用很小,而文字本身的質量起主要作用

而目前主流搜尋引擎,對文字是否符合自然語言表述方式,還缺乏足夠有效的手段來區分和鑑別

例如下面這段牛頭不對馬嘴的文字,人是明顯能看出問題的,但如何讓計算機也能鑑別出來呢?

比如下面這段文字:

簡單的防守,已經讓這群低等級的怪物消失了,不到5分鐘,那幾百萬的大軍,連玩家一根毫毛也沒傷到的全部被消滅了。超**破天一劍私之服 「我有時不敢愛,因為我的條件太差了,現在的人都很現實的。我以前認為只要兩個人是真心相愛,其他的都無所謂,可結果告訴我,我錯了。」。。。是這樣麼?這個世界就真的沒有所謂「不現實」的人麼???

說完,人竟然已經衝了上來,乙個衝上,前因後果igotit,乙個斬下,阿風一驚,因為他連他們的動作也很難看清,但是只要人在半空,他馬上在最後用出了獨孤九劍。

類似的作弊頁還有:

搜尋引擎反作弊之 鏈結作弊與隱藏作弊

本文節選自 這就是搜尋引擎 核心技術詳解 第八章 8.2 鏈結作弊 所謂 鏈結作弊 是 擁有者考慮到搜尋引擎排名中利用了 鏈結分析 技術,所以通過操縱頁面之間的鏈結關係,或者操縱頁面之間的鏈結錨文字,以此來增加鏈結排序因子的得分,並影響搜尋結果排名的作弊方法。常見的鏈結作弊方法眾多,此節簡述幾種比較...

搜尋引擎對作弊的判斷條件

對作弊的判斷條件 1 在網頁源 的任意位置,故意加入與網頁內容不相關的關鍵詞。2 在網頁源 的任意位置,故意重複某些關鍵詞。即使與網頁內容相關的關鍵詞,故意重複也被認為是作弊。3 在網頁中加入搜尋引擎可識別但使用者看不到的隱藏文字。無論是使用同背景色文字,超小字號文字,文字隱藏層還是濫用alt 都屬...

搜尋引擎對SEO作弊的判定條件

seo作弊方式有很多種形式,比如 網域名稱轟炸 彈出新視窗轉向 製作link farm 鏈結養殖場等等。對於seo作弊,搜尋引擎公開的判定條件如下 google 對作弊的判定條件 使用隱藏文字或隱藏鏈結。採用隱藏真實內容或欺騙性重定向手段。向 google 傳送自動查詢。使用無關用語載入網頁。建立包...