用python寫爬蟲整的很方便,弄了個模擬登陸,登陸後帶上token和cooke請求頁面
就拿gitlab練下手了,這個還是有一丟丟麻煩的
一、登陸介面
獲取隱藏域中的token,構建表單的時候需要
獲取到這個_gitlab_session,登陸校驗時需要帶著這個資訊
準備好token和cookie,當然還需要乙個能登陸使用者名稱和密碼
二、登陸驗證
登陸驗證就是構建表單,不知為何還要傳乙個utf-8引數
按說應該可以登陸進去的,但是....登陸進去後頁面會重定向到乙個介面。接著呢,只好看fiddle裡抓包的資訊
之前一直以為沒有登陸成功,其實已經登陸成功,但是請求需要登陸頁面,還是會跳轉到登陸介面。。
原來登陸成功後會獲取乙個新的session,然後需要調整 headers裡面的資訊
再用這個headers去請求需要登陸的頁面,發現都可以了
**如下,寫得很隨意:
print("登陸成功:",newcook)
print("登陸前的:",cook)
postdata["username"] ="你的賬號"
postdata["password"] ="你的密碼"
發現,寫模擬登陸需要很耐心,對比真實的http請求headers裡面的資訊,再去構建模擬請求的
有時間再弄個有驗證碼的,應該也簡單,畢竟都有驗證碼識別的api了
Python爬蟲模擬登陸豆瓣
coding utf 8 import requests,re from pil import image class doubanspider object def init self self.session requests.session def login self,username,pa...
python爬蟲人人網登陸
匯入模組from urllib import request,parse from http import cookiejar 儲存cookie,例項化cookiecookie cookiejar.cookiejar com plogin.do 登入賬號密碼data 轉換格式data parse.u...
python 爬蟲登陸學校教務系統
好像很多人寫爬蟲,都是從登陸學校教務系統開始的。為什麼?學校教務系統渣啊,都是明文傳輸的,而且是200x年寫的,沒有用到很多現在的技術,所以相對來說容易些。感覺很多學校都是用的清元優軟的這個,我們學校還有驗證碼,稍微高階了一點。整體思路 1 對用firefox httpfox進行抓包,發現驗證碼是在...