正規表示式的概念
正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成乙個「規則字串」,這個「規則字串」用來表達對字串的一種過濾邏輯。
python將正規表示式放在了re模組
正規表示式的用處及重要性
廣泛應用於爬蟲領域、大資料領域。
不僅僅在python領域,在整個程式設計領域都有很重要的地位。
用法:正規表示式中的字元組:
[字元組]
正規表示式
待匹配字元
匹配結果
解釋[0123]
sdfa34
3在乙個字元組中放入字元,任意乙個字元和待匹配字元相同都視為匹配成功
[453]
safd
無結果因為字元組中沒有,匹配不到
[0-9]44
[0-9]等價[0123456789]
[a-z]
sd32
sd[a-z]代表所有小寫字母
[a-z]
sfsdf
sdf[a-z]代表所有大寫字母
[a-z0-8a-t]
af243fg
af243fg
可以匹配到所有大寫字母,數字0到8,小寫字母a到t
正規表示式中的字元:
字元匹配內容1.
除換行符以外的所有字元2\w
字母或數字或下劃線3\s
任意的空白符4\d
數字5\w非字母或數字或下劃線6\d
非數字7
\s非空白符8\n
乙個換行符9\t
乙個製表符
10\b
乙個單詞的結尾11^
字串的開始12$
字串的結尾
13a|b
字元a或字元b
14()
括號內的表示式,也表示乙個組
15[…]
字元組中的字元
16[^…]
除了字元組中字元的所有字元
正規表示式中的量詞
量詞用法1*
重複0次或多次2+
重複依次或多次3?
重複0次或1次
4重複n次
5重複n次或多次
6重複n到m次
用法舉例
. 放在字元後面
正規表示式
待匹配的字串
匹配結果
.agfdsa
agfdsa
^ 放在字元的前面
正規表示式
待匹配的字串
匹配結果
^aagfdsa
a$ 放在字元後面
正規表示式
待匹配的字串
匹配結果
s$agfdsa
python正規表示式元字元 正規表示式
字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...
Python 正規表示式
1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...
Python正規表示式
學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...