importurllib.requestimporttime
defrefresh():
#urllib.httperror: http error 403: forbidden錯誤是由於**禁止爬蟲,可以在請求加上頭資訊,偽裝成瀏覽器訪問
# 在請求加上頭資訊,偽裝成瀏覽器訪問
header =
url =''request = urllib.request.request(url,headers = header)
page = urllib.request.urlopen(request).read()
print(page.decode('utf-8'))#解決中文亂碼問題
time.sleep(5) #相隔五秒重新整理一次部落格
if__name__ =='__main__':
foriinrange(1,10):# 迴圈十次
refresh()
python3 5實現socket通訊 TCP)
tcp連線 tcp是面向連線的乙個協議,意味著,客戶端和伺服器開發傳送資料之前,需要先握手建立乙個tcp連線。tcp連線的一端與客戶端套接字相互聯絡,另一端與伺服器套接字相聯絡。當建立該tcp連線的時,我們需要講客戶端與伺服器的套接字位址 ip位址和埠號 關聯起來。使用建立的tcp連線,當一側要向另...
python 3 5 學習筆記
字串方法 msg this is message msg.title 首字母大寫 msg.lower 字串全部小寫 msg.upper 字串全部大寫 msg.rstrip 刪除字串前後的空格 msg.lstrip 刪除字串前面的空格 msg.strip 刪除字串後面的空格 str msg 將msg轉...
python 3 5 爬蟲日記2
from urllib import request 輸入正規表示式模組 import re page 1 url r request.request url r.add header user agent abc 讀取首頁原碼並命名為content content request.urlopen ...