爬蟲異常處理

2021-09-27 02:06:57 字數 818 閱讀 2637

狀態碼

含義200(成功)

(成功) 伺服器已成功處理了請求。 通常,這表示伺服器提供了請求的網頁

301(永久移動)

請求的網頁已永久移動到新位置。伺服器返回此響應(對 get 或 head 請求的響 應)時,會自動將請求者轉到新位置。

302(臨時移動)

伺服器目前從不同位置的網頁響應請求,但請求者應繼續使用原有位置來響應以後的請求。

304 ( 未 修改)

自從上次請求後,請求的網頁未修改過。伺服器返回此響應時,不會返回網頁內容。

401 ( 未 授權)

請求要求身份驗證。

403(禁止)

沒有許可權,禁止訪問

404 ( 未 找到)

伺服器找不到請求的網頁。

500(伺服器內部錯誤)

伺服器遇到錯誤,無法完成請求。

503(服務不可用)

伺服器目前無法使用(由於超載或停機維護)。通常,這只是暫時狀態。

# 連不上伺服器

# 伺服器不存在

# 本地沒有網路

# 觸發了httperror子類

from urllib import error, request

try:

request.urlopen('')

except error.urlerror as err:

if hasattr(err, 'code'):

print(err.code)

if hasattr(err, 'reason'):

print(err.reason)

爬蟲異常處理

在這個模組中 urllib.error urlerror httperror都是異常處理類,為了讓 更加的健壯 exception 官方的異常基類,所有的異常類都是直接或者間接的繼承這個類 urlerror 如果斷網或者主機不存在 httperror 請求的資源不存在,比如404 urlerror可...

爬蟲 異常處理

爬蟲的異常處理 網頁在伺服器上不存在 或者獲取頁面的時候出現錯誤 伺服器不存在 第一種異常發生時,程式會返回 http 錯誤。http 錯誤可能是 404 page not found 500 internal server error 等。所有類似情形,urlopen函式都會丟擲 httperro...

python爬蟲 爬蟲異常處理

異常處理概述 常見狀態碼和含義 urlerror與httperror 爬蟲遇到異常時就會直接崩潰停止執行,下次再次執行時,又會重新開始。所以開發乙個具有頑強生命力的爬蟲,必須進行異常處理。兩者都是異常處理的類,httperror是urlerror的子類,httperror有異常狀態碼與異常原因,ur...