步驟:
呼叫平台(這裡使用的是超級鷹)提供的示例**進行資料識別
**:
#爬取古詩文網登入介面的驗證碼並識別(
from lxml import etree
from hashlib import md5
import requests
import self
class
chaojiying_client
(object):
def__init__
(self, username, password, soft_id)
: self.username = username
password = password.encode(
'utf8'
) self.password = md5(password)
.hexdigest(
) self.soft_id = soft_id
self.base_params =
self.headers =
defpostpic
(self, im, codetype)
:"""
im: 位元組
codetype: 題目型別 參考
"""params =
params.update(self.base_params)
files =
r = requests.post(
'', data=params, files=files, headers=self.headers)
return r.json(
)def
reporterror
(self, im_id)
:"""
im_id:報錯題目的id
'這裡放超級鷹賬號'
,'這裡放超級鷹密碼'
,'96001'
)# 使用者中心》軟體id 生成乙個替換 96001
)# 本地檔案路徑 來替換 a.jpg 有時win系統須要//
print
(chaojiying.postpic(im,
1902))
# 1902 驗證碼型別 在超級鷹官網》**體系 3.4+版 print 後要加()
python 爬取12306驗證碼
import ssl import urllib2 i 1import time while 1 不加的話,無法訪問12306 time.sleep 1 有時需要加延時,以防被封。i i 1 f.write data f.close 以下就是爬取的 的截圖 12306的驗證碼經常讓人眼花繚亂,眼睛仔...
爬蟲反爬之驗證碼
if name main chaojiying chaojiying client 超級鷹使用者名稱 超級鷹使用者名稱的密碼 96001 使用者中心 軟體id 生成乙個替換 96001 本地檔案路徑 來替換 a.jpg 有時win系統須要 print chaojiying.postpic im,19...
資料爬取 超級鷹驗證碼識別
usr bin env python coding utf 8 import requests from hashlib import md5 class chaojiying client object def init self,username,password,soft id self.us...