1、「.」為萬用字元,表示任何乙個字元,例如:「a.c」可以匹配「anc」、「abc」、「acc」;
2、「」,在內可以指定要求匹配的字元,例如:「a[nbc]c」可以匹配「anc」、「abc」、「acc」;但不可以匹配「ancc」,a到z可以寫成[a-z],0到9可以寫成[0-9];
3、數量限定符號,表示匹配次數(或者叫做長度)的符號:
包括:「*」——0次或者多次
「+」——1次或者多次
「?」——0次或者1次
「」——匹配n次,n為整數
「」——匹配從n到m之間的某個數的次數;n和m都是整數;
「」——匹配n到無窮次之間任意次數;
「」——匹配0到m之間任意次數;
他們放到匹配格式的後面:
例如:**號碼:024-84820482,02484820482(假設前面3或者4位,後面7或者8位,並且中間的減號可有可無)
都是符合規定的,那麼可以用如下格式來匹配:[0-9] /-? [0-9];
注意:「/」為轉義字元,因為「-」在正規表示式用有代表乙個範圍的意義,例如:前面所說的[0-9],
所以它需要轉義字元「/」進行轉義才可使用;
4、「^」為否符號,表示不想匹配的符號,例如:[^z][a-z]+可以匹配所有除「z」開頭的以外的所有字
符串(長度大於2,因為「+」表示大於等於1的次數,從第二位開始都是小寫英文本元);
如果^放到的外邊則表示以開頭的字串;^[az][a-z]+表示a或者z開頭的長度大於等於2的英文本元
串;5、「|」或運算子,例如:a[n|bc|cb]c可以匹配「abcc」,「anc」,「acbc」;
6、「$」以它前面的字元結尾的;例如:ab+$就可以被「abb」,「ab」匹配;
7、一些簡單表示方法:
/d表示[0-9];/d表示[^0-9];/w表示[a-z0-9];/w表示[^a-z0-9];/s表示[/t/n/r/f],就是空格字元包括tab
,空格等等;/s表示[^/t/n/r/f],就是非空格字元;
8、常用的匹配:
匹配中文字元: 「[/u4e00-/u9fa5]」;
匹配雙位元組字元(包括漢字在內):「[^/x00-/xff]」;
匹配空行的正規表示式:「/n[/s| ]*/r」;
匹配html標記的正規表示式:「/<(.*)>.*|<(.*) //>/」;
匹配首尾空格的正規表示式:「(^/s*)|(/s*$)」;
匹配非負整數(正整數 + 0):「^/d+$」;
匹配正整數:「^[0-9]*[1-9][0-9]*$」;
匹配非正整數(負整數 + 0):「^((-/d+)|(0+))$」;
匹配負整數:「^-[0-9]*[1-9][0-9]*$」;
匹配整數:「^-?/d+$」;
匹配非負浮點數(正浮點數 + 0):「^/d+(/./d+)?$」
匹配正浮點數:「^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*
))$」;
^((-/d+(/./d+)?)|(0+(/.0+)?))$ //匹配非正浮點數(負浮點數 + 0)
^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配
備忘(五)正規表示式
正規表示式 regular expression 是一種功能強大的字串樣式比較技術。正規表示式最早是從unix系統被開發出來的。它是由一群特殊符號所組成的字串,表示特定的文字樣式,被用於比較某段字串或文章裡,符合正規表示式所代表的樣式文字,例如,乙個簡單的正規表示式 1 9 可以用來表示字串中1 9...
正規表示式整理備忘
1 符號 符下兩ows表研究室的火熱,當晨在 雖然並非c 正規表示式的 成員 但是它經常與c 正規表示式出雙入對。表示,跟在它後面的字串是個 逐字字串 不是很好理解,舉個例子,以下兩個宣告是等效的 string x d my huang my doc string y d my huang my d...
正規表示式備忘筆記
1.常用的元字元 說明 匹配除換行符以外的任意字元 w 匹配字母或數字或下劃線或漢字 s 匹配任意的空白符 d 匹配數字 b 匹配單詞的開始或結束 匹配字串的開始 匹配字串的結束 2.常用的限定符 說明 重複零次或更多次 重複一次或更多次 重複零次或一次 重複n次 重複n次或更多次 重複n到m次 3...