小析百度貼吧

2022-10-05 00:51:14 字數 1186 閱讀 7784

最近又開始總談百度和google了,因為我無意中發現我妹妹竟然是百度某乙個貼吧的吧主。而她僅僅六年級。

先前的文章談了好多關於百度與google在中國差距之原因的淺薄之見,文字粗糙,不成體系。既然這些思緒都是由我妹妹貼吧吧主之事而來,那麼這次就侃侃百度貼吧吧。

我知道百度貼吧是一次閒來無事在網上搜我乙個同學的名字。結果稀里糊塗的進了他的名字命名的貼吧。我還以為找到了真經,結果當然裡面的東西和我同學風馬牛程式設計客棧不相及。但是,我卻還是會不時的造訪這裡,因為我一直確定某一天真正我要找的那個同學會在這裡留下他的痕跡。

說這個例子就可以很自然的引入gijkdfb正題。我想我以上的行為很能說明百度貼吧的乙個核心——我不知道該怎麼形容——權且叫他最細分關鍵詞(真難聽)

最細分關鍵詞顧名思義就是極度細分,涵蓋意思最原始最單一的關鍵詞。對於搜尋引擎來說,處理這些最細分資料無外乎兩種結果,最精確和最不精確,似乎很難出現中間狀態。因為本身這種資料是最細分的,代表著最精確,當搜尋引擎資料庫中有這些關鍵詞的資料時那麼返回的結果肯定是最精確的。反之則沒有結果或者結果質量很差。這也是搜尋引擎一直很頭痛的問題。對於關鍵詞ibm,搜尋引擎肯定會很準確的返回關於ibm的結果。而輸入ibm詞的人肯定是在想知道關於ibm的事。但輸入張早陽呢。反正如果想找我的話無關結果會很多。但是如果我為我自己開乙個貼吧呢!情況出現了轉機,呵呵,搜尋引擎可以在貼吧裡找到我的資訊並返回結果。當然,貼吧也會有重名者,但是如果全世界所有叫張早陽的都聚在這個貼吧裡呢,那麼就完全有可能會返回匹配結果。這也就是為什麼我堅信我會在我同學名字貼吧裡最終找到他的訊息的原因。

再說一種情況。就是關鍵詞及其罕見,冷的不能再冷了。網上相關資料數根本沒有。再強大的搜尋技術也無能為力了。但是,貼吧就為這種罕見關鍵詞的內容帶來了生機。因為再冷也會程式設計客棧有人關注,這些人可以利用貼吧來發布一些程式設計客棧文字。於是,搜尋引擎便有了返回的結果,搜尋使用者也有了找到了自己要找的東西。

不要小看這些冷門詞,所有的冷門詞加在一塊絕對是一條長尾。這些長尾的使用者量之大也許真的可以決定乙個搜尋引擎的命運。既然不小心帶出了長尾這個詞,那就再順便說說貼吧的長尾效應。冷門詞加一塊是長尾這是其一。其www.cppcns.com二就是貼吧這種對於最細分關鍵詞的把握可以無窮盡的製造出關鍵詞內容來,那麼就是一條無窮盡長尾。

先粗略分析了一下貼吧細分關鍵詞的問題。既然是錯略的分析就難免有不當的地方。有機會再說說貼吧在聚合上的一些個人理解。先睡了。

作者:張早陽

本文標題: 小析百度貼吧

本文位址:

python百度貼吧發帖簽到 百度貼吧簽到指令碼

本指令碼為我從網上各渠道蒐集到的簽到指令碼的雜交 如果不需要日誌則把帶 日誌記錄 的行刪除即可 from requests import session from time import time 日誌記錄 start time time 資料 log path f e data sign log ...

百度貼吧爬蟲

encoding utf 8 import urllib.request import urllib.parse import time import random def load page url 通過url來獲取網頁內容jfa param url 待獲取的頁面 return url對應的網頁內...

爬取百度貼吧

import urllib.request import urllib.parse import os,time 輸入貼吧名字 baname input 請輸入貼吧的名字 start page int input 請輸入起始頁 end page int input 請輸入結束頁 不完整的url ur...