在做文字處理的時候,經常會使用正規表示式,每次使用的時候,都要使用搜尋引擎,怎麼樣才能熟練掌握,提高自己開發的效率,故決定 把正規表示式梳理一下,方便自己掌握
如果是單個分隔符,可以直接使用字串的
s = "hello,csdn"
print(s.split(","))
多個分隔符使用正規表示式
import re
# 中文分句
doc = "厲害了!經參報道,近期,包括廣東、北京、上海等多地都在密集出台新一輪促消費政策。業內指出,從這一輪的促消費政策來看,乙個明顯的特點是打造國際消費中心城市、步行街公升級版、培育夜經濟等成為多地的抓手,消費公升級有了新路徑、新平台。預計政策密集落地將為消費注入強心劑,從國家和地方層面將會有更多政策利好落地……不知道能不能超額完成?"
sents = re.split(r'。|?|!|;|……|\?|!|;',doc)
精準替換 直接使用 str.replace()
模糊替換,需要使用 re.sub()
def html_clean(text):
"""清理文字中的 html 格式
"""#替換 ;
text = text.replace('& nbsp ;','')
#替換 url
# 替換 html標籤
text = re.sub(r']+>', '', text)
return text
python中正規表示式
python中正規表示式語法與linux中的相容 檢視正規表示式 python提供re模組,包含所有正規表示式的功能。由於python的字串本身也用 轉義,所以要特別注意 s abc 001 python的字串 對應的正規表示式字串變成 abc 001 建議使用python的r字首,就不用考慮轉義的...
Python 中 正規表示式
一 最近要對字串執行很多操作,所以學了正規表示式 不得不說正規表示式對字串的操作還是很給力的 runoob上面的教程 python中的正規表示式 正規表示式教程 python中要使用正規表示式,首先要匯入re模組 import re 二 常用函式 或者說方法 re.match 作用 嘗試從字串的起始...
Python中正規表示式
python re模組正規表示式中常用的字元有兩類 普通字元和11個元字元,元字元表示特定的功能,比如下面的 被括起來的表示式將作為分組,從表示式左邊開始每遇到乙個分組的左括號 編號 1。分組表示式作為乙個整體,可以後接數量詞。表示式中的 僅在該組中有效。那麼我們想匹配表示式中的 字元怎麼辦呢?通過...