正規表示式與python

2021-05-11 11:31:25 字數 966 閱讀 3593

在python中有乙個非常重要也非常好用的模組re,在import re後,就能夠在python中使用正規表示式,源於此次專案要用正規表示式對html**提取一定的字元,所以在這也就用些小例子來熟悉一下正規表示式

現在就用最簡單的例子

print re.findall(r'(.+)執行後結果為

這個相對來說還是比較簡單的,但是這個正規表示式還是有比較多的問題

1對於比較複雜的字串,比如巢狀了標籤的字串,就沒有辦法了,因為只能夠判斷最外一層的<>標記而已

2是這個是判斷具有類似<>標記的字串,對於實際的html中的提取,還是要加上具體的值,比如是title,還是head

import re

s=''

print re.findall(r'title>(.+)執行後得到

雖然在這個比較簡單的**中我們解決了上述兩個問題,但是針對html中更加複雜的**,我覺得還是會有很多的問題

不過今天也就是簡單的熟悉一下正規表示式,所以也就不再去深入研究,經過隊員的討論後在**解決問題的方案

下面給出乙個判斷郵箱位址是否合法的正規表示式

郵箱主要包括@和.,所以在判斷的時候也只需假如這兩個條件就可以了

import re

s='[email protected]

[email protected]

zhusdandsai@adsd'

print re.findall(r'(/w+@/w+/./w+)',s)

執行結果

['[email protected]', '[email protected]']

>>>

python正規表示式元字元 正規表示式

字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...

Python 正規表示式

1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...

Python正規表示式

學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...