爬蟲快速入門 Get請求的使用

# 專案名稱：
# 專案簡介：
# 作   者：key
from urllib.request import urlopen, request  # 開啟url，和封裝請問
from fake_useragent import useragent  # 獲取headers
from urllib.parse import quote  # 轉為為url使用的unicode編碼
from urllib.parse import urlencode  # 和quote功能相同，但是傳入字典，可以一次轉化多個引數，並完成拼接
import random
# url ='' \
#       '%25a6%25e6%25b1%2589%25e5%25ad%25a6%25e9%2599%25a2&rsv_pq=ad90e4730010b099&rsv_t=cbd2illvjvfzhsq2z' \
#       '%2btwysywcvqrpypgsdek4l2e%2fxmbeui2lbvlijvzzxs&rqlang=cn&rsv_enter=0&rsv_dl=tb&rsv_btype=t '
# 但實際的呢？我們發出請求響應測試，只需要'武漢學院'就行了
# url ="'武漢學院'"
# 但是呢，中文的武漢學院，url並不能識別
# 所以，我們要用url.parse裡面的quote物件，轉化為url可以識別的unicode編碼
# print(quote('武漢學院'))    # 輸出資訊： %e6%ad%a6%e6%b1%89%e5%ad%a6%e9%99%a2
# url = "'%e6%ad%a6%e6%b1%89%e5%ad%a6%e9%99%a2'" # 如果在瀏覽器訪問 wd之後就不需要加字串
# 一般使用{}.format(quote("輸入資訊"))去替換
url =
'{}'
.format
(quote(
'武漢學院'))
# 使用urlencode進行轉化
# args = 
# url = str("".format(urlencode(args)))
# print(''.format(urlencode(args)))
# 列印的資訊：%e6%ad%a6%e6%b1%89%e5%ad%a6%e9%99%a2&ie=utf-8
# 開發者工具獲取headers
headers =
# 建立物件獲取headers
# headers = 
# 封裝
request = request(url, headers=headers)
# 訪問
response = urlopen(request)
# 列印返回資訊,一定要用decode()轉化，才是可讀資料
print
(response.read(
).decode(
))

爬蟲 urllib的get請求

quote 方法是將漢字轉換成unicode編碼 import urllib.request import urllib.parse url 請求物件的定製是為了解決反爬的第一種手段 headers 將周杰倫三個漢字變成unicode編碼的格式需要依賴urllib.parse name ur...

初探python爬蟲（一） get請求

爬蟲步驟請求方式 get和post requests 安裝 pip install requests import requests 定義請求的url url 定義請求頭資訊 headers 發起get請求 res requests.get url url,headers headers 獲取相應...

爬蟲1 get與post請求

一使用requests或urllib用get方法進行請求這個就是使用requests使用get方法進行請求輸出的結果這個就是請求後得到的網頁html原始碼 2.使用urllib.request.open獲得的response 2.如果是斷開網路了，就是無效請求，則會返回404 3.什麼是請求頭，...

爬蟲快速入門 Get請求的使用

爬蟲 urllib的get請求

初探python爬蟲（一） get請求

爬蟲1 get與post請求

相關推薦