爬蟲基礎 HTTP基本原理

爬蟲基礎-http基本原理: uri: 統一資源標誌符 url: 是uri的子集一般的網頁鏈結既可成為url也可稱為uri 超文字: html源** http和https: http: 用於從網路傳輸超文字資料到本地瀏覽器的傳輸協議。 https: http的安全版本，加入了ssl層 http的請求過程: 傳送乙個請求，**伺服器接受到這個請求後進行處理和解析然後返回對應的響應，接著傳回給瀏覽器，瀏覽器再進行解析請求:客戶端向服務端發出請求方法: get post: 在位址列輸入url並回車，這便發起了乙個get請求 get引數包含在url裡面，post則不會 get方法提交資料最多只有1024個位元組 post沒有限制一般登入時，需要寫入使用者名稱和密碼的時候，使用post方式請求**: 即為url 請求頭: 說明伺服器使用的附加資訊 cookie referer user-agent 請求體: 承載post請求中的表單資料響應:響應狀態碼: 200正常 404頁面未找到 500伺服器內部錯誤響應頭: data: 標識響應時間 last-modified: 指定資源最後修改時間 content-encoding: 指定響應內容編碼 server: 包含伺服器的資訊 content-type: 文件型別 set-cookie: 設定cookies expires: 指定響應過期時間響應體:

響應的徵文資料都在相應體中(network中preview可看到網頁源**)

爬蟲基礎 HTTP基本原理

爬蟲基礎 HTTP基本原理

爬蟲基本原理

爬蟲基本原理

爬蟲基礎 HTTP基本原理

爬蟲基礎 HTTP基本原理

爬蟲基本原理

爬蟲基本原理

相關推薦