Python爬蟲入門1

2021-09-24 21:25:00 字數 1220 閱讀 7283

請求url

請求方式

post

請求頭cookie

user-agent

請求體utf8,authenticity_token,login,password,webauthn-support,commit請求url

請求方式

get請求頭

cookie

user-agent

import re

import requests

headers =

defget_page

(urls)

: response = requests.get(urls, headers=headers)

return response

form_data =

if __name__ ==

'__main__'

:# 登入鏈結

login_url =

''# 請求物件資源

login_res = get_page(login_url)

# 請求cookie字典化

login_cookie = login_res.cookies.get_dict(

)# 獲取token

re_str =

'' token = re.findall(re_str, login_res.text, re.s)

# 設定請求資料

form_data[

'authenticity_token'

]= token[0]

# 請求鏈結

session_url =

''# 請求物件資源

session_res = requests.post(session_url, headers=headers, cookies=login_cookie, data=form_data)

with

open

("github.html"

,'w'

, encoding=

'utf-8'

)as f:

f.write(session_res.text)

print

(session_res.status_code)

Python爬蟲入門1 序章

老猿python博文目錄 老猿學爬蟲應該是2019年7月初開始的,學習了2個多月,寫了免費的 爬蟲專欄 在該專欄內爬蟲實戰應用的場景與網上大部分已知的場景基本都不一樣,是從復用 登入會話資訊來開發應用的。如果要從 登入開始寫應該也可以,但老猿沒有去做這方面的工作,因為網上有很多這樣的文章。老猿的這種...

爬蟲入門 1

requests 方法說明 requests.request 構造乙個請求,支撐以下各方法的基本方法 requests.get 獲取html網面的方法 requests.head 獲取html網頁頭部資訊的方法 requests.post 向html網頁提交post請求的方法 requests.pu...

python爬蟲(1) 入門教程

網頁一般由三部分組成,分別是 html 超文字標記語言 css 層疊樣式表 和 jscript 活動指令碼語言 1 html html 是整個網頁的結構,相當於整個 的框架。帶 符號的都是屬於 html 的標籤,並且標籤都是成對出現的。2 css css 表示樣式,圖 1 中第 13 行 style...