1、匹配:
import re
str=
""result = re.match(r"<\w*>.*"
,str
)print
(result)
執行結果:說明:html中的<>和/匹配時仍舊使用<>和/
\w可以匹配數字、字母、下劃線、希臘字母、俄文本母等
*表示至少有0個
.匹配任意單字元,除了換行符\n
上述匹配有乙個缺陷,"
result = re.match(r"<(\w*)>.*"
,str
(result)
'''()表示組的意思
(\w*)表示有內容的乙個組
\1表示第一組,和前面的\w*是一樣的同一組
'''
2、匹配:
import re
str=""
result = re.match(r"<(\w*)><(\w*)>.*"
,str
)print
(result)
執行結果:說明:找到組的一一對應關係,從左往右數,組數從1開始然後按組別進行匹配
'>
匹配案例2還有另外一種寫法:
import re
str=""
result = re.match(r"<(?p\w*)><(?p\w*)>.*"
,str
)print
(result)
'''?p表示給組設定變數名,將其定義在組內。<>裡的名字隨意,如name1,name2都可以
(?p=n1) 表示使用變數,只不過把組當作乙個變數,然後在使用這個變數
'''
正規表示式匹配html標籤table
首先,要匹配任意內容 是不行的,因為不匹配 n 取不到想要的內容,所以有了如下表示式 s s 當然,你也可以用 d d w w 來表示。現在我們來匹配乙個html標籤,匹配table如下 s s table 或 s s table 以上兩個表示式,乙個加了 和乙個卻不加 那麼這有什麼區別呢?我們知道...
使用正規表示式匹配巢狀Html標籤
概述 正規表示式是做文字解析工作必不可少的技能。如web伺服器日誌分析,網頁前端開發等。很多高階文字編輯器都支援正規表示式的乙個子集,熟練掌握正規表示式,經常能夠使你的一些工作事半功倍。例如統計 行數,只需乙個正則就搞定。巢狀html標籤的匹配是正規表示式應用中乙個比較難的話題,因為它涉及到的正則語...
使用正規表示式匹配巢狀Html標籤
正規表示式是做文字解析工作必不可少的技能。如web伺服器日誌分析,網頁前端開發等。很多高階文字編輯器都支援正規表示式的乙個子集,熟練掌握正規表示式,經常能夠使你的一些工作事半功倍。例如統計 行數,只需乙個正則就搞定。巢狀html標籤的匹配是正規表示式應用中乙個比較難的話題,因為它涉及到的正則語法比較...