#處理異常,urllib的error模組定義了由requeat模組產生的異常。
from urllib import request,error
try:
response = request.urlopen(『
except error.urlerror as e:
print(e.reason)
#urlerror裡的屬性reason返回錯誤的原因
#2.httperror是urlerror的子類,專門用來處理http請求錯誤,比如認證請求失敗。
#屬性一:code:返回http狀態碼,200為正常,404網頁不存在,500伺服器內部錯誤
#屬性二:reason 同父類一樣,用於返回錯誤的原因
#屬性三:headers 返回請求頭,例項如下
#先捕獲httperror,獲取它的錯誤狀態碼,原因,headers等資訊。如不是捕獲urlerror異常,最後用else來處理正常的邏輯
import socket
import urllib.request
import urllib.error
try:
response = urllib.request.urlopen(『
except urllib.urlerror as e:
print(type(e.reason))
if isinstance(e.reason,socket.timeout):#用isinstance()方法來判斷它的型別,做出更詳細的異常判斷
print(『time out』)
urllib庫的使用
import urllib.request data urllib.request.urlopen print urlopen原始碼 不支援新增headers 請求頭部 def urlopen url,data none timeout socket.global default timeout,c...
基本庫的使用 urllib
最基礎的http 庫有urllib httplib2 requests treq 等。使用urllib urllib 庫,它是python 內建的http 請求庫,也就是說不需要額外安裝即可使用。它包含如下4 個模組。request 它是最基本的http 請求模組,可以用來模擬傳送請求。就像在瀏覽器...
Urllib庫的基本使用
爬取網頁 爬取網頁其實就是根據url來獲取它的網頁資訊,雖然我們在瀏覽器中看到的是一幅幅優美的畫面,但是其實是由瀏覽器解釋才呈現出來的,實質它是一段html 加 js css,如果把網頁比作乙個人,那麼html便是他的骨架,js便是他的肌肉,css便是它的衣服。所以最重要的部分是存在於html中的,...