話不多說,分析一波csdn的閱讀數,是每次進入頁面記作一次,所以我們很簡單的構建乙個訪問的小爬蟲就好了,那麼開始操作。
import requests
import time
from lxml import etree
import random
defpost_article()
:'''下面url換成自己的,獲取自己所有部落格的鏈結'''
response = requests.get(url=
'me_url'
,headers = getheaders())
text = response.content.decode(
'utf-8'
) html = etree.html(text)
urls = html.xpath(
'//h4/a/@href'
)for url in urls:
defaccess_url()
:'''訪問其中乙個url,隨機從自己的部落格中選中進行訪問'''
try:
url = random.choice(article_url)
response = requests.get(url, headers=getheaders())
time.sleep(2)
except exception as e :
print
(e)
根據上面的**,你的部落格閱讀數會蹭蹭的**,唉,想想都淚奔,要靠這種,
我們下面寫一下注意的就可以,設定headers,還有睡眠時間等,頻繁的訪問會使伺服器拒絕為你增加閱讀數,you ok?(散裝英語).
再加上我們設定的headers:
def
getheaders()
: user_agent_list =
[ \, \
, \, \
, \, \
, \, \
, \, \
, \, \
, \, \
, \, \
, \]
useragent = random.choice(user_agent_list)
headers =
return headers
主程式**塊:
if __name__ ==
'__main__'
: index =
0 post_article(
)print
('進行到這了。。。'
)while
true
: access_url(
)print
(index)
index +=
1'''自己隨意設計的次數'''
if index ==
100000
:break
這個小爬蟲就這麼出來了,不要過度使用,只為學習技術,有任何糾紛跟我無關(瑟瑟發抖)。 Python爬蟲刷CSDN部落格閱讀數
本部落格僅做技術交流。刷部落格訪問量可恥。原始碼語言為python3。這裡採用西刺免費 ip 先爬取這些免費的ip,然後偽裝成這些ip訪問指定的部落格,從而增加指定文章的閱讀數。以下原始碼以博主的csdn賬號為例,將url自行修改即可訪問自己的博文。注意 刷的太快伺服器並不會增加文章的閱讀數,可自行...
初賽 閱讀程式 題答v1 0
核心要義 是設法弄清程式的功能,每個題目的寫作目的。一 方法 1 直接模擬 一般適用於t1 t2中的遞迴題,計算題等沒有演算法的題。2 看出演算法直接填 最佳方法。需要較多模板,但耗時少,準確率高。3 模擬幾次後找規律 不知道演算法時採用 大膽猜測,小心求證 適用性較廣,且一般都對,但耗時較多。4 ...
初賽 閱讀程式 題答v1 0
核心要義 是設法弄清程式的功能,每個題目的寫作目的。一 方法 1 直接模擬 一般適用於t1 t2中的遞迴題,計算題等沒有演算法的題。2 看出演算法直接填 最佳方法。需要較多模板,但耗時少,準確率高。3 模擬幾次後找規律 不知道演算法時採用 大膽猜測,小心求證 適用性較廣,且一般都對,但耗時較多。4 ...