響應狀態碼表示伺服器的響應狀態。在爬蟲中,我們可以根據狀態碼來判斷伺服器響應狀態,如狀態碼為200,則證明成功返回資料,再進行進一步的處理,否則直接忽略。以下給出常見的錯誤**及錯誤原因
狀態碼說明
詳情100
繼續請求者應當繼續提出請求。伺服器已經接收到請求的一部分,正在等待其餘部分
101切換協議
請求者已要求伺服器切換協議,伺服器已確認並準備切換
200成功
伺服器已成功處理了請求
201已建立
請求成功並且伺服器已經建立了新的資源
202已接受
伺服器已成功處理了請求,但尚未處理
203非授權資訊
伺服器已成功處理了請求,但返回的資訊可能來自另乙個源
204無內容
伺服器成功處理了請求,但沒有返回任何內容
205重置內容
伺服器成功處理了請求,但內容被重置
206部分內容
伺服器成功處理了部分請求
300多種選擇
針對請求,伺服器可執行多種操作
301永久移動
請求的網頁已永久移動到新位置,即永久重定向
302臨時移動
請求的網頁暫時跳轉到其他頁面,即暫時重定向
303檢視其他位置
如果原來的請求時post,重定向目標文件應該通過get提取
304未修改
此次請求返回的網頁未修改,繼續使用上次的資源
305使用**
請求者應該使用**訪問該網頁
307臨時重定向
請求的資源臨時從其他位置響應
400錯誤請求
伺服器無法解析該請求
401未授權
請求沒有進行身份驗證或驗證未通過
403禁止訪問
伺服器拒絕此請求
404未找到
伺服器找不到請求的網頁
405方法禁用
伺服器禁用了請求中指定的方法
406不接受
無法使用請求的內容響應請求的網頁
407需要**授權
請求者需要使用**授權
408請求超時
伺服器請求超時
409衝突
伺服器在完成請求時發生衝突
410已刪除
請求的資源永久刪除
411需要有效長度
伺服器不接受不含有效內容長度標頭字段的請求
412為滿足前提條件
伺服器未滿足請求者在請求中設定的其中乙個前提條件
413請求實體過大
請求實體過大,超過伺服器的處理能力
414請求url過長
請求**過長,伺服器無法處理
415不支援型別
請求格式不被請求頁面支援
416請求範圍不符
頁面無法提供請求的範圍
417為滿足期望值
伺服器為滿足期望請求標頭字段的要求
500伺服器內部錯誤
伺服器遇到錯誤,無法完成請求
501未實現
伺服器不具備完成請求的功能
502錯誤閘道器
伺服器作為閘道器或**,從上游伺服器收到無效響應
503伺服器不可用
伺服器目前無法使用
504閘道器超時
伺服器作為閘道器或**,但是沒有及時從上游伺服器收到請求
505http版本不支援
伺服器不支援請求中所用的http協議版本
響應頭包含了伺服器對請求的應答資訊,一下給出常用的應答資訊:
所有內容全部引自《python3 網路爬蟲開發實戰(人民郵電出版社)》,此筆記僅用於學習交流。
HTTP請求頭 響應頭和狀態碼
accept 瀏覽器通過這個頭告訴伺服器,它所支援的資料型別。如 text html,image jpeg accept charset 瀏覽器通過這個頭告訴伺服器,它支援哪種字符集。accept encoding 瀏覽器通過這個頭告訴伺服器,它支援哪種壓縮格式。accept language 瀏覽...
http請求響應狀態碼
1xx 臨時響應 表示臨時響應並需要請求者繼續執行操作的狀態 說明 100 繼續 請求者應當繼續提出請求。伺服器返回此 表示已收到請求的第一部分,正在等待其餘部分。101 切換協議 請求者已要求伺服器切換協議,伺服器已確認並準備切換。2xx 成功 表示成功處理了請求的狀態 說明 200 成功 伺服器...
HTTP請求 響應狀態碼
1 請求響應方式 get是從伺服器上獲取資料,post是向伺服器傳送資料。get 資料在位址列中明文的形式傳送,post則不是,傳遞的資料比get多 據rfc2616標準 現行的http 1.1 得知,通常有以下8種方法 options get post head put delete trace和...