上面我們說了request請求物件的裡有data引數,它就是用在post裡的,我們要傳送的資料就是這個引數data,data是乙個字典,裡面要匹配鍵值對。
下面來介紹乙個例子,使用有道詞典翻譯**來講解。
輸入測試資料,再通過使用fiddler觀察,其中有一條是post請求,而向伺服器傳送的請求資料並不是在url裡,那麼我們可以試著模擬這個post請求。
於是,我們可以嘗試用post方式傳送請求。
import urllib
import urllib2
# post請求的目標url
url =
""headers=
formdata =
data = urllib.urlencode(formdata)
request = urllib2.request(url, data = data, headers = headers)
response = urllib2.urlopen(request)
print response.read(
)
傳送post請求時,需要特別注意headers的一些屬性:有些網頁內容使用ajax載入,只要記得,ajax一般返回的是json,直接對ajax位址進行post或get,就返回json資料了。
「作為一名爬蟲工程師,你最需要關注的,是資料的**」
import urllib
import urllib2
# demo1
url =
""headers=
# 變動的是這兩個引數,從start開始往後顯示limit個
formdata =
data = urllib.urlencode(formdata)
request = urllib2.request(url, data = data, headers = headers)
response = urllib2.urlopen(request)
print response.read(
)# demo2
url =
""headers=
# 處理所有引數
2 爬蟲基礎 urllib2模組
底層操作request物件 請求頭設定之useragent使用者 請求頭設定 使用者 useragent 自定義請求頭訊息 請求方式之get post請求 get請求處理 post請求處理 handler處理器自定義開鎖人opener 自定義http opener 自定義proxy opener 會...
爬蟲 urllib2 Headers 常用
爬蟲 學習筆記 爬蟲請求 時要模擬瀏覽器,這就要用到user agent pc端useragent phone useragent 利用構建好的useragents.py檔案來充當爬蟲請求頭 usr bin env python coding utf 8 import urllib2 import ...
Python爬蟲之urllib模組2
python爬蟲之urllib模組2 pg 55,乙個待畢業待就業的二流大學生。看了一下上一節的反饋,有些同學認為這個沒什麼意義,也有的同學覺得太簡單,關於 beautifulsoup 和lxml 獲取後面的鏈結我們能不能如法炮製呢,我們先來試試。我們把 寫成下面那樣 然後我們現在來試試 結果我們發...