正規表示式匹配html標籤table

2021-06-20 22:05:44 字數 491 閱讀 4827

首先,要匹配任意內容「.」是不行的,因為不匹配「\n」,取不到想要的內容,所以有了如下表示式:

[\s\s]*

當然,你也可以用 「[\d\d]*」、「[\w\w]*」 來表示。

現在我們來匹配乙個html標籤,匹配table如下:

[\s\s]*<\/table>

或[\s\s]*?<\/table>

以上兩個表示式,乙個加了"?"和乙個卻不加「?」,那麼這有什麼區別呢?

我們知道「?」在正規表示式裡是乙個萬用字元:匹配前面的子表示式零次或一次,或指明乙個非貪婪限定符。

在這裡,通過測試,我們得出這樣的結論:在不加「?」的情況下,在匹配下面一段內容的時候:

這是第乙個table

我不是table裡的內容

這是第二個table

我也不是table裡的內容

這是第三個table

會把以開始,結束的內容都匹配出來

加了「?」之後,只匹配第n個匹配的內容

正規表示式匹配html標籤

1 匹配 import re str result re.match r w str print result 執行結果 說明 html中的 和 匹配時仍舊使用 和 w可以匹配數字 字母 下劃線 希臘字母 俄文本母等 表示至少有0個 匹配任意單字元,除了換行符 n 上述匹配有乙個缺陷,result ...

使用正規表示式匹配巢狀Html標籤

概述 正規表示式是做文字解析工作必不可少的技能。如web伺服器日誌分析,網頁前端開發等。很多高階文字編輯器都支援正規表示式的乙個子集,熟練掌握正規表示式,經常能夠使你的一些工作事半功倍。例如統計 行數,只需乙個正則就搞定。巢狀html標籤的匹配是正規表示式應用中乙個比較難的話題,因為它涉及到的正則語...

使用正規表示式匹配巢狀Html標籤

正規表示式是做文字解析工作必不可少的技能。如web伺服器日誌分析,網頁前端開發等。很多高階文字編輯器都支援正規表示式的乙個子集,熟練掌握正規表示式,經常能夠使你的一些工作事半功倍。例如統計 行數,只需乙個正則就搞定。巢狀html標籤的匹配是正規表示式應用中乙個比較難的話題,因為它涉及到的正則語法比較...