requests簡單理解

2021-09-12 21:43:28 字數 669 閱讀 3367

requests物件的get和post方法都會返回乙個response物件,這個物件裡面存的是伺服器返回的所有資訊,包括響應頭,響應狀態碼等。其中返回的網頁部分會存在.content和.text兩個物件中。兩者區別在於,content中間存的是位元組碼,而text中存的是beautifulsoup根據猜測的編碼方式將content內容編碼成字串。直接輸出content,會發現前面存在b'這樣的標誌,這是位元組字串的標誌,而text是',沒有前面的b,對於純ascii碼,這兩個可以說一模一樣,對於其他的文字,需要正確編碼才能正常顯示。大部分情況建議使用.text,因為顯示的是漢字,但有時會顯示亂碼,這時需要用.content.decode('utf-8'),中文常用utf-8和gbk,gb2312等。這樣可以手工選擇文字編碼方式。.text是現成的字串,.content還要編碼,但是.text不是所有時候顯示都正常,這是就需要用.content進行手動編碼

簡而言之:

text返回的是unicode型的資料 

content返回的是是二進位制的資料。 

也就是說,如果你想取文字,可以通過r.text。 

如果想取,檔案,則可以通過r.content

再附上一張requests的圖:

requests模組的簡單使用

簡單來說,requests就是乙個可以模擬傳送請求的庫。安裝方法 pip install requests幫助文件 直接呼叫requests模組的get方法就可以傳送get請求。返回值為乙個response物件 import requests url response requests.get ur...

requests模組簡單用法

1 import requests 2import random34 請求傳送的 url 5 url 6 請求頭資訊,通常用於偽裝瀏覽器,通過伺服器校驗 7 headers 11 建立乙個 ip池,裡面儲存各個 ip的字典資料 12 proxies 1314 get請求需要攜帶的引數 url後面的引...

Python 理解使用requests庫爬取資料

requests庫是爬取資料的第三方庫,安裝方法 pip3 install requests用法 r requests.get url r 是返回的response物件,有五個最常用的屬性 屬性說明 r.status code http返回的請求狀態,200表示成功,400表示失敗 r.text h...