xmlhttp.readystate的值及解釋:
0:請求未初始化(還沒有呼叫 open())。
1:請求已經建立,但是還沒有傳送(還沒有呼叫 send())。
2:請求已傳送,正在處理中(通常現在可以從響應中獲取內容頭)。
3:請求在處理中;通常響應中已有部分資料可用了,但是伺服器還沒有完成響應的生成。
4:響應已完成;您可以獲取並使用伺服器的響應了。
xmlhttp.status的值及解釋:
100——客戶必須繼續發出請求
101——客戶要求伺服器根據請求轉換http協議版本
200——交易成功
201——提示知道新檔案的url
202——接受和處理、但處理未完成
203——返回資訊不確定或不完整
204——請求收到,但返回資訊為空
205——伺服器完成了請求,使用者**必須復位當前已經瀏覽過的檔案
206——伺服器已經完成了部分使用者的get請求
300——請求的資源可在多處得到
301——刪除請求資料
302——在其他位址發現了請求資料
303——建議客戶訪問其他url或訪問方式
304——客戶端已經執行了get,但檔案未變化
305——請求的資源必須從伺服器指定的位址得到
306——前一版本http中使用的**,現行版本中不再使用
307——申明請求的資源臨時性刪除
400——錯誤請求,如語法錯誤
401——請求授權失敗
402——保留有效chargeto頭響應
403——請求不允許
404——沒有發現檔案、查詢或url
405——使用者在request-line欄位定義的方法不允許
406——根據使用者傳送的accept拖,請求資源不可訪問
407——類似401,使用者必須首先在**伺服器上得到授權
408——客戶端沒有在使用者指定的餓時間內完成請求
409——對當前資源狀態,請求不能完成
410——伺服器上不再有此資源且無進一步的參考位址
411——伺服器拒絕使用者定義的content-length屬性請求
412——乙個或多個請求頭字段在當前請求中錯誤
413——請求的資源大於伺服器允許的大小
414——請求的資源url長於伺服器允許的長度
415——請求資源不支援請求專案格式
416——請求中包含range請求頭欄位,在當前請求資源範圍內沒有range指示值,請求也不包含if-range請求頭欄位
417——伺服器不滿足請求expect頭欄位指定的期望值,如果是**伺服器,可能是下一級伺服器不能滿足請求
合起來500——伺服器產生內部錯誤
501——伺服器不支援請求的函式
502——伺服器暫時不可用,有時是為了防止發生系統過載
503——伺服器過載或暫停維修
504——關口過載,伺服器使用另乙個關口或服務來響應使用者,等待時間設定值較長
505——伺服器不支援或拒絕支請求頭中指定的http版本
1xx:資訊響應類,表示接收到請求並且繼續處理
2xx:處理成功響應類,表示動作被成功接收、理解和接受
3xx:重定向響應類,為了完成指定的動作,必須接受進一步處理
4xx:客戶端錯誤,客戶請求包含語法錯誤或者是不能正確執行
5xx:服務端錯誤,伺服器不能正確執行乙個正確的請求
xmlhttp.readystate4 && xmlhttp.status200的解釋:請求完成並且成功返回
清洗網頁資料
ascii american standard code for information interchange美國標準資訊交換碼 只能表示128個字元 這個大家都是很熟悉的,從32是空格,然後是一堆符號,然後是48 57表示0 9,65 90是a z,97 122是a z。就是很少,也只有英文本母...
python 抓取網頁資料
利用python進行簡單的資料分析 1 首先要進行分析網頁的html,我們所要抓取的資料是根據銷量排名的手機資訊,所以主要需要抓取手機的型號 銷量,按照 由小見大 的方法來獲取所需要的html資訊,如下圖所示 由上可以看出手機型號所在的html標籤是 h3 手機 是在div中的class屬性為 pr...
網頁資料抓取 爬蟲
資料抓取其實從字面意思就知道它是抓取資料的,在網際網路世界中,資料量是乙個非常大的。有時候靠人為去獲取資料這是乙個非常不明智的。尤其是你需要的資料來自很多不同的地方。網路爬蟲是是一種按照一定的規則,自動地抓取網際網路 資訊的程式或者指令碼。它主要抓取形式有兩種 1種是抓取網頁鏈結,通過url鏈結得到...