python模擬登陸實踐

2022-07-14 10:24:11 字數 1401 閱讀 4196

對於一些需要登陸的**爬取資料,需要登入才能訪問。本文介紹如何利用python進行模擬登陸

準備工具:  

1.搭建django 框架 用於模擬登陸

2.fiddler抓包工具,chrome瀏覽器

3.pycharm   編輯器

步驟:進入      這是django自帶的後台,進行登陸時,django自帶了  csrf 跨站指令碼攻擊的防禦系統,這裡進入瀏覽器的除錯模式,找到csrf 所在標籤下的value值

django通過改變這個value值,來達到防止跨站攻擊的效果。

2.用先前建立的superuser賬號 123   zxc123456進行登陸,同時使用fiddler進行抓包

這裡就是進行表單提交時需要的引數

#

coding=utf-8

import

requests

from lxml import

etree

# 請求頭也可以從fiddler中直接複製過來,按照字典的格式

headers =

#session =requests.session()

defget_xsrf():

"""獲取引數

"""response = session.get('

', headers=headers)

html =response.text

selector =etree.html(html)

# 這裡我是通過xpath獲取value值,也可以通過正規表示式

_xsrf = selector.xpath('

//*[@id="login-form"]/input/@value')

print

_xsrf,html

return

_xsrf

deflogin():

# url通過fiddler抓取登陸時的url

url = '

login/?next=/admin/

'data =

# 帶表單的post請求

result = session.post(url, data=data, headers=headers)

# 登陸成功後可以通過 請求需要登陸的位址進行測試

# result2 = session.get('url',headers=heders)

# print result2.text

print

result.text

if__name__ == '

__main__':

login()

登陸成功,接下來就可以爬取你想要的資料了

Python 模擬登陸

主要講述賬號密碼登陸,cookie登陸,3.cookie cookie 是伺服器對每個請求使用者的標識,伺服器可以通過cookie判斷請求使用者是不是同乙個人,經常我們登入 時,登陸成功以後我們關閉頁面,我們再次去進入這個頁面,已經是登入狀態了。cookie也有時效性,一定時間以後cookie就會失...

Python模擬登陸

這裡用知乎 www.zhihu.com 來測試的python的模擬登陸操作 首先用firefox和fiddler來攔截所有對知乎的請求,包括進入登陸的頁面的url www.zhihu.com signin 和登陸的url www.zhihu.com login phone num 檢視頁面的源 需要...

普通python模擬登陸

usr bin python import htmlparser import urlparse import urllib import urllib2 import cookielib import string import re 登入的主頁面 hosturl post資料接收和處理的頁面 我...