爬蟲需要正規表示式,網頁賬戶登入也有運用到正規表示式。
正規表示式測試工具:編輯器內建的工具,控制台、regexr-cn.com
?:前面那個字元可以出現0次、1次;
*:前面那個字元可以出現0次、多次
+:匹配前面的字元一次或多次
:匹配前面的字元確定的有n次
:匹配前面字元出現次數2-6次
|:物件包含「|」左邊或者右邊的字元均可以匹配
1)[abc]:匹配所包含的任意乙個字元
2)[a-za-z]:匹配任意的的英文本元
3)[a-za-z]:匹配所有英文本元和數字
4)[ ^0-9 ]:匹配所有非數字字元
\d: 匹配乙個數字字元。等價於 [0-9]。
\d:匹配乙個非數字字元。等價於 [ ^0-9 ]。
\w:匹配字母、數字、下劃線。等價於』[a-za-z0-9_]』。
\w:匹配非字母、數字、下劃線。等價於 『[ ^a-za-z0-9_]』。
\s:匹配任何空白字元,包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。
\s:匹配任何非空白字元。等價於 [ ^ \f\n\r\t\v]。
\b:匹配單詞邊界,就是單次和空格間的位置
^:匹配輸入字串的開始位置。
$:匹配輸入字串的結束位置。
\:將下乙個字元標記為特殊字元。
*:匹配前面的子表示式零次或多次。
?:匹配前面的子表示式零次或一次。
+:匹配前面字元一次或多次
.:匹配除換行符 \n 之外的任何單字元。要匹配 . ,請使用 . 。
(pattern):匹配 pattern 並獲取這一匹配。所獲取的匹配可以從產生的 matches 集合得到,在vbscript 中使用 submatches 集合,在jscript 中則使用 $0…$9 屬性。要匹配圓括號字元,請使用 『(』 或 『)』。
學習資料可以參考
正規表示式 正則入門
先從乙個例子開始正規表示式。書寫乙個匹配手機號的正規表示式,為了方便討論,假定手機號是1開頭,第二位只能是3 5 8中的其中乙個,總共11位的數字,形如13 匹配手機號的正規表示式為 1 358 d 下面介紹此正規表示式中的各個符號的含義。表示字串的開頭,後面緊接著1,表示匹配的字串要以 1 開頭。...
正規表示式入門
對於文字字元,有11個字元被保留作特殊用途。他們是 這些特殊字元也被稱作元字元 不可顯示字元 可以使用特殊字串行來代表某些不可顯示字元 代表tab 0x09 代表回車符 0x0d 代表換行符 0x0a 字符集 字符集是由一對方括號 括起來的字元集合。使用字符集,你可以告訴正規表示式引擎僅僅匹配多個字...
正規表示式入門
老師說過 正規表示式就是用字串讀取字串!學習正規表示式的最好方法是從例子開始,理解例子之後再自己對例子進行修改,實驗。下面給出了不少簡單的例子,並對它們作了詳細的說明。假設你在一篇英文 裡查詢hi,你可以使用正規表示式hi。這幾乎是最簡單的正規表示式了,它可以精確匹配這樣的字串 由兩個字元組成,前乙...