Requests庫網路爬蟲實戰(5個例項)

2021-10-04 01:29:42 字數 1801 閱讀 1594

import requests

url =

""#京東mate30 5g

try:

r = requests.get(url)

r.raise_for_status(

)#如果不是200,則產生異常

print

(r.text[

:1000])

except

:print

("爬取失敗"

)

import requests

url =

""#亞馬遜python網路爬蟲權威指南(第2版)(圖靈圖書)

try:

#新增headers,不加headers狀態返回為503,爬出失敗。用headers將爬蟲模擬為瀏覽器即可訪問爬取。

kv =

r = requests.get(url,headers=kv)

r.raise_for_status(

) print

(r.text[

1000

:2000])

except

:print

("爬取失敗"

)

import requests

keyword =

"python"

try:

kv =

r = requests.get(

"",params=kv)

#通過字典傳遞關鍵字

print

(r.request.url)

r.raise_for_status(

)print

(len

(r.text)

)except

:print

("爬取失敗"

)

import requests

import os

url =

""root =

"d://python//"

path = root + url.split(

'/')[-

1]try:

ifnot os.path.exists(root)

: os.mkdir(root)

ifnot os.path.exists(path)

: r = requests.get(url)

with

open

(path,

'wb'

)as f:

f.write(r.content)

#contnt返回二進位制檔案

f.close(

)print

("檔案儲存成功"

)else

:print

("檔案儲存成功"

)except

:print

("爬取失敗"

)

#未知原因爬取不了

import requests

url =

""try:

kv =

r = requests.get(url+

'202.204.80.112'

,headers=kv)

r.raise_for_status(

) print

(r.text[

-500:]

)except

:print

("爬取失敗"

)

<

python網路爬蟲之requests庫

import requests1 requests庫有兩個物件,request物件和response物件,下表是response物件的屬性 屬性說明 r.status code http請求的返回狀態,200表示連線成功,404表示失敗 r.text http響應內容的字串形式,即,url對應的頁面...

網路爬蟲之Requests庫入門

requests庫是python中用於網路爬蟲的較為簡單的庫。其中語法格式如下 r requests.get url,params none kwargs 1 構造乙個向伺服器請求資源的request物件,包含爬蟲返回的去不得內容 2 返回乙個包含伺服器資源的response物件 url 你獲取頁面...

python網路爬蟲之requests庫 二

前面一篇在介紹request登入csdn 的時候,是採用的固定cookie的方式,也就是先通過抓包的方式得到cookie值,然後將cookie值加在傳送的資料報中傳送到伺服器進行認證。就好比獲取如下的資料。然後加入到header資訊中去 構造的cookie值 cookie 但是這樣的實現方式有乙個問...