requests模組的入門使用
目標掌握requests傳送請求的方法
掌握response物件的基礎屬性
掌握requests傳送帶headers的請求
掌握requests模組傳送帶引數請求
為什麼要重點學習requests模組,而不是urllib
requests的底層實現就是urllib requests在python2 和python3中通用,方法完全一樣
requests簡單易用
requests能夠自動幫助我們解壓(gzip壓縮的等)網頁內容
2.requests的作用
作用:傳送網路請求,返回響應資料
中文文件 :
通過觀察文件來學習:如何使用requests來傳送網路請求?
response = requests.get(url)
response的常用屬性:
response.text
respones.content
response.status_code
response.request.headers
response.headers
text是response的屬性還是方法呢?
一般來說名詞,往往都是物件的屬性,對應的動詞是物件的方法
3.1 response.text 和response.content的區別
response.text
型別:str
解碼型別: 根據http 頭部對響應的編碼作出有根據的推測,推測的文字編碼
如何修改編碼方式:response.encoding=」gbk」
response.content
型別:bytes
解碼型別: 沒有指定
如何修改編碼方式:response.content.deocde(「utf8」)
獲取網頁原始碼的通用方式:
response.content.decode()
response.content.decode("gbk")
response.text
以上三種方法從前往後嘗試,能夠100%的解決所有網頁解碼的問題
4.2 為什麼請求需要帶上header?
模擬瀏覽器,欺騙伺服器,獲取和瀏覽器一致的內容
4.3 header的形式:字典
4.4 用法
requests.get(url,headers=headers)
5.傳送帶引數的請求
5.1 什麼叫做請求引數:
錯誤的列1:
正確的例2:
5.2 引數的形式:字典
kw =
5.3用法
requests.get(url,params=kw)
對應的,在後續的爬蟲中,越到很多引數的url位址,都可以嘗試刪除引數
重點掌握requests模組的基本使用
掌握響應的基礎屬性的使用
requests模組入門
requests庫是比urllib更加方便實用的http第三方庫,它支援http連線保持和連線池,支援使用cookie保持會話,支援檔案上傳,支援自動響應內容的編碼,支援國際化的url和post資料自動編碼。requests.request 構造乙個方法,它是支撐以下各方法的基礎方法。request...
爬蟲之requests模組的入門使用
為什麼要重點學習requests模組,而不是urllib requests的底層實現就是urllib requests在python2 和python3中通用,方法完全一樣 requests簡單易用 requests能夠自動幫助我們解壓 gzip壓縮的等 網頁內容 requests模組傳送簡單的ge...
requests模組的使用
寫在前面的話 在學習爬蟲入門時,會常用到requests模組,熟悉這個模組的使用需要熟悉http,https 及瀏覽器的請求原理。初次接觸爬蟲時了解下,掌握瀏覽器的請求過程和爬蟲的本質,學起來就輕鬆多啦。get response requests.get url,headers headers ge...