1、匹配a標籤 :
2、正則匹配頁面所有a標籤或img標籤
publicmatchcollection物件取group的方法很好用。推薦!!static arraylist cutstr(string sstr, string
patrn)
} }
catch
(system.exception ex)
return
al;
}
匹配頁面所有a標籤正則: (.+)
這個只能匹配不換行的a。一換行就完蛋。換這個試試:]+?href=\"([^\"]+)\"[^>]*>([^
繼續新增改進版本:可以匹配href後面跟 單引號,雙引號或者不跟符號的情況:
]+?href=["']?([^"']+)["']?[^>]*>([^
匹配頁面所有img標籤正則:
在另一篇博文中看到乙個關於正則匹配img標籤的例子,貼過來看一下:
(?! - 負向預查後面的字元正規表示式基礎教程:.*?貪婪匹配logo前面所有資料
(?!.*?logo) - 意為匹配所有不包含logo
.*/>
則是 匹配所有換行前的》 - 此處不使用 .*? 進行貪婪主要是為了避免 alt="abc>" 這樣中間出現》 字元的情況
不過上面會出現個特例情況
例如alt提示包含logo
自定義屬性
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式使用總結
匹配年月日 0 9 1 9 0 9 1 9 0 9 0 9 1 9 0 9 1 9 0 9 0 13578 1 02 0 1 9 12 0 9 3 01 0 469 11 0 1 9 12 0 9 30 02 0 1 9 1 0 9 2 0 8 匹配中文 u4e00 u9fa5 匹配雙位元組字元,包...
正規表示式使用總結
b 並不匹配這些單詞分隔字元中的任何乙個,它只匹配乙個位置 匹配除了換行符以外的任意字元 前面的內容可以連續重複使用任意次 即0次或多次 前面的內容可以出現0次或1次 匹配任意數量的不包含換行的字元 前面的內容可以連續重複使用1次或多次 即1次或多次 匹配重複任意次,但盡可能少重複的字元 匹配重複1...