工作以來一直在csdn上寫部落格,最近想把部落格整理一遍,重新上傳。
無奈有大量冗餘部落格,所以寫個指令碼,批量刪除部落格。
request url:
accept-encoding:gzip, deflate
accept-language:ja,en;q=0.9
cookie:'cookie內容'
host:write.blog.csdn.net
proxy-connection:keep-alive
referer:
開啟通過js獲取id的集合。
# 設定headers
body=body_data.encode('utf-8'), # 關鍵:資料要傳入 body 引數,不是 fields
headers=headers)
print(r.data.decode())
url=''
sendrequest(url+'部落格的id')哈哈,部落格清空了。
**張永光的部落格
python3爬取CSDN個人所有文章列表頁
沒什麼技術含量就是簡單的xpath處理,不過有意思的是有一位csdn員工將自己的部落格位址寫到原始碼裡面了,是乙個隱藏的div,不過在 中我已經給過濾掉了。優化了響應時長,畢竟需要分頁爬去,如果不用多執行緒響應時間必然會隨著文章分頁的增多而增多。實現 import requests from lxm...
python3爬取CSDN個人所有文章列表頁
沒什麼技術含量就是簡單的xpath處理,不過有意思的是有一位csdn員工將自己的部落格位址寫到原始碼裡面了,是乙個隱藏的div,不過在 中我已經給過濾掉了。優化了響應時長,畢竟需要分頁爬去,如果不用多執行緒響應時間必然會隨著文章分頁的增多而增多。實現 import requests from lxm...
python3 切片 python3 切片
取乙個list或tuple的部分元素是非常常見的操作。比如,乙個list如下 l michael sarah tracy bob jack 取前3個元素,應該怎麼做?笨辦法 l 0 l 1 l 2 michael sarah tracy 之所以是笨辦法是因為擴充套件一下,取前n個元素就沒轍了。取前n...