python 刪除爬蟲裡無法識別的表情字元

2021-09-26 03:40:56 字數 531 閱讀 4076

def character(a):

try: # 如果報錯,則獲取報錯的字串資訊

dk.write(a)

dk.close()

except exception as error:

# 處理字串,獲取報錯的內容

u = str(error).split(" '")

u_error = str(u[1]).split("' ")

b = re.sub(u_error[0], '', a) # 刪除字串a裡所有的報錯字串

dk.write(b)

dk.close()

第二種:使用try...except...的方式處理字串中每個字元,刪除無法識別的表情字元。

def character(a):

for i in a:

try:

dk.write(i)

except:

pass

dk.close()

python爬蟲之OCR驗證碼識別

ocr驗證碼初探 隨機獲取驗證碼儲存到專案的根目錄下 今天第寫乙個簡單的驗證碼識別例子小夥伴說識別出來的跟預想的不一樣,主要是我寫的例子驗證的比較簡單,而小夥伴識別的內有多餘的線條干擾了的識別。對於這種情況我們需要對進行一下處理,例如轉灰度 二值化等操作。我這裡就可以識別出來了,但是有的識別出來的還...

python中刪除colnames裡的nan值

最近得到乙個dict,是這樣子的 map sorted 想把nan刪掉,但是用 map sorted.pop nan traceback most recent call last file line 1,in keyerror nan map sorted.pop nan traceback mo...

python爬蟲 爬取驗證碼並識別

步驟 呼叫平台 這裡使用的是超級鷹 提供的示例 進行資料識別 爬取古詩文網登入介面的驗證碼並識別 from lxml import etree from hashlib import md5 import requests import self class chaojiying client ob...