python爬蟲 爬取驗證碼並識別

2021-10-10 11:45:45 字數 1873 閱讀 3924

步驟:

呼叫平台(這裡使用的是超級鷹)提供的示例**進行資料識別

**:

#爬取古詩文網登入介面的驗證碼並識別(

from lxml import etree

from hashlib import md5

import requests

import self

class

chaojiying_client

(object):

def__init__

(self, username, password, soft_id)

: self.username = username

password = password.encode(

'utf8'

) self.password = md5(password)

.hexdigest(

) self.soft_id = soft_id

self.base_params =

self.headers =

defpostpic

(self, im, codetype)

:"""

im: 位元組

codetype: 題目型別 參考

"""params =

params.update(self.base_params)

files =

r = requests.post(

'', data=params, files=files, headers=self.headers)

return r.json(

)def

reporterror

(self, im_id)

:"""

im_id:報錯題目的id

'這裡放超級鷹賬號'

,'這裡放超級鷹密碼'

,'96001'

)# 使用者中心》軟體id 生成乙個替換 96001

)# 本地檔案路徑 來替換 a.jpg 有時win系統須要//

print

(chaojiying.postpic(im,

1902))

# 1902 驗證碼型別 在超級鷹官網》**體系 3.4+版 print 後要加()

python 爬取12306驗證碼

import ssl import urllib2 i 1import time while 1 不加的話,無法訪問12306 time.sleep 1 有時需要加延時,以防被封。i i 1 f.write data f.close 以下就是爬取的 的截圖 12306的驗證碼經常讓人眼花繚亂,眼睛仔...

爬蟲反爬之驗證碼

if name main chaojiying chaojiying client 超級鷹使用者名稱 超級鷹使用者名稱的密碼 96001 使用者中心 軟體id 生成乙個替換 96001 本地檔案路徑 來替換 a.jpg 有時win系統須要 print chaojiying.postpic im,19...

資料爬取 超級鷹驗證碼識別

usr bin env python coding utf 8 import requests from hashlib import md5 class chaojiying client object def init self,username,password,soft id self.us...