請求url
請求方式
post
請求頭cookie
user-agent
請求體utf8
,authenticity_token
,login
,password
,webauthn-support
,commit
請求url
請求方式
get請求頭
cookie
user-agent
import re
import requests
headers =
defget_page
(urls)
: response = requests.get(urls, headers=headers)
return response
form_data =
if __name__ ==
'__main__'
:# 登入鏈結
login_url =
''# 請求物件資源
login_res = get_page(login_url)
# 請求cookie字典化
login_cookie = login_res.cookies.get_dict(
)# 獲取token
re_str =
'' token = re.findall(re_str, login_res.text, re.s)
# 設定請求資料
form_data[
'authenticity_token'
]= token[0]
# 請求鏈結
session_url =
''# 請求物件資源
session_res = requests.post(session_url, headers=headers, cookies=login_cookie, data=form_data)
with
open
("github.html"
,'w'
, encoding=
'utf-8'
)as f:
f.write(session_res.text)
print
(session_res.status_code)
Python爬蟲入門1 序章
老猿python博文目錄 老猿學爬蟲應該是2019年7月初開始的,學習了2個多月,寫了免費的 爬蟲專欄 在該專欄內爬蟲實戰應用的場景與網上大部分已知的場景基本都不一樣,是從復用 登入會話資訊來開發應用的。如果要從 登入開始寫應該也可以,但老猿沒有去做這方面的工作,因為網上有很多這樣的文章。老猿的這種...
爬蟲入門 1
requests 方法說明 requests.request 構造乙個請求,支撐以下各方法的基本方法 requests.get 獲取html網面的方法 requests.head 獲取html網頁頭部資訊的方法 requests.post 向html網頁提交post請求的方法 requests.pu...
python爬蟲(1) 入門教程
網頁一般由三部分組成,分別是 html 超文字標記語言 css 層疊樣式表 和 jscript 活動指令碼語言 1 html html 是整個網頁的結構,相當於整個 的框架。帶 符號的都是屬於 html 的標籤,並且標籤都是成對出現的。2 css css 表示樣式,圖 1 中第 13 行 style...