框架用多了,都是別人寫好的一些內容,最近想自己手寫乙份爬蟲模擬登陸系統,手寫有什麼好處呢?可以讓你更好的去理解爬蟲系統.我用的linux系統,pycharm版本3.6,
首先手寫的你需要安裝requests:pip3 install requests
我們以訪問抽屜為例:
接下來我們模擬登陸,模擬登陸我們需要模仿瀏覽器提交的資料,提交的方式為post,在這裡我們帶上前面獲取的cookie,帶上登陸需要的賬號密碼,並且帶上user-agent來模擬瀏覽器登陸,不然會被攔截
response = requests.post(
url='login',
data=,
headers=,
cookies = r1.cookies.get_dict()
最後,我們可以檢測有沒有登陸成功
print(response.text)
結果如下:
}} 說明登陸成功了,登陸成功那麼該頁面我們就可以獲取頁面和解析頁面來爬蟲了,這裡就不介紹了
總體**如下:
import requests
response = requests.post(
url='login',
data=,
print(response.text)
爬蟲入門四(驗證碼識別和模擬登陸)
超級鷹的使用流程 超級鷹 import requests from hashlib import md5 class chaojiying client object def init self,username,password,soft id self.username username pas...
python 爬蟲(7) 驗證碼登陸 12306
登陸乙個介面需要使用者名稱 密碼 還有驗證碼。驗證碼的辨識,一般都是第三方,且需要付費的。比如雲打碼,打碼兔,超級鷹。12306用的是超級鷹。得到驗證碼 1.訪問網頁 3.儲存到本地 4.識別驗證碼 得到字串或者數字 from lxml import etree import requests he...
curl模擬請求 登陸以及帶驗證碼登陸
php view plain copy header content type text html charset utf 8 function curlpost url data method curl setopt ch curlopt returntransfer,true tmpinfo c...