正規表示式小結

2021-08-07 22:05:01 字數 1981 閱讀 1158

正規表示式:regex 英 ['redʒeks]

1,\d\d\d\d或者是\d   表示匹配4位數的數字。

2.**說明。這些可被稱作元字元。

.匹配除換行符以外的任意字元1%*_jk2yh$#@jj

\w數字字母漢字下劃線 bst456_5ghgtft

\s匹配任意的空白符 space  table鍵和半全形空格

\d匹配數字  digit

\d  非數字

\d\d 所有字元。

\b匹配單詞的開始或結束

4.常用的限定符

**/語法說明

*重複零次或更多次  [0-9]*    無或者無限個數字。

+重複一次或更多次

?重複零次或一次     [0-9]?   0次或1次數字

重複n次

重複n次或更多次

重複n到m次

5,綜合利用

width=".+?"| height=".+?"| class=".+?"| x:str|| cellpadding=".+?"| cellspacing=".+?"||

|||| style='.+?'

6,()提公升優先順序的,分組。

7.^ 1.匹配字串的開始,2.非

^[0-9][a-z]$ :匹配下例 而不能匹配66ppp.匹配內容前後無內容了。

66ppp

注意^$指的是行首和行尾。

[0-9][a-z] :66ppp  666ppp67867中的也匹配

^\d$ (^$表示行首行位) 匹配整行是5到12位純數字的字串。

8.通過下面的表示式可以匹配出html中的標籤。

\\s]+))?)+\\s*|\\s*)/?>

9,身份證最後一位:[0-9xx]

10,?重複零次或一次     [0-9]?   0次或1次數字

[1-9]([a-z])?    :123    123dd

11.例如身份證:

^[1-9]\d[1-2]\d((0[1-9])|(1[0-2]))(([0-2]\d)|(3[0-1]))\d([0-9xx])$

12,郵箱

[0-9a-za-z_.-]+@[0-9a-za-z_.]+([.][a-za-z]+)

13,零寬斷言

(?<=).*(?=)匹配不包含屬性的簡單html標籤內裡的內容。((\w+)>)指定了這樣的字首:被尖括號括起來的單詞(比如可能是),然後是.*(任意的字串),最後是乙個字尾(?=)。注意字尾裡的\/,它用到了前面提過的字元轉義;\1則是乙個反向引用,引用的正是捕獲的第一組,前面的(\w+)匹配的內容,這樣如果字首實際上是的話,字尾就是了。整個表示式匹配的是之間的內容(再次提醒,不包括字首和字尾本身)。

15,匹配帶**的標籤

加@,帶屬性的全部再加雙引號。

@"18 漢字類(為了去除:號,就在中額外新增了中文冒號)

[^\x00-\xff:]+           揹負噴霧器:

19】原始字串:我是程式設計師 

正則:(.*)(([^不是]|[^是]|)程式設計師)(.*) 

替換為:$1工程師$4

這樣可以替換什麼?比較複雜,它會匹配「程式設計師」,但是不能匹配「不是程式設計師」或者「是程式設計師」。 

這時正則裡面有4個括號,所以最後乙個匹配項要用$4。

\1是乙個反向引用

$替換中的引用

20】vs2010的:(至[^(\:|:)])|(至$)

匹配」至「後不帶冒號的。

至$:以至結尾的。

21】標記html標籤

]*>|

22】某html標籤對

vs2010中:\

23】行

^(\s*)\r\n

24】匹配:以漢字開頭又以漢字結尾,中間可以是任意長度的字元

\b[^\x00-\xff].*[^\x00-\xff]\b

若要非單行匹配則前面加:(?is)

25】正規表示式測試器

和regexbuddy

fei 正規表示式 正規表示式小結

常用的元字元常用的反義 常用的限定符 語法 說明 語法 說明 語法 說明 w 匹配字母或數字或下劃線或漢字 w匹配任意不是字母 數字 下劃線 漢字的字元 重複零次或者更多次 s匹配任意的空白字元 s匹配任意不是空白符的字元 重複一次或更多次 d匹配數字 d匹配任意非數字的字元 重複零次或一次 b匹配...

正規表示式小結

最近學習了正規表示式,趁還熱乎,寫下這篇部落格,記錄一下。正規表示式 英語 regular expression,在 中常簡寫為regex 正規表示式是乙個字串,使用單個字串來描述 用來定義匹配規則,匹配一系列符合某個句法規則的字串。在開發中,正規表示式通常被用來檢索 替換那些符合某個規則的文字,也...

正規表示式小結

代表任意字元。代表0至多個。代表一至多個。b 代表單詞的開頭或結尾。b 代表不是單詞的開頭或結尾 w 代表數字 字母 下劃線 漢字。w 代表非數字 字母 下劃線 漢字。s 代表 s 代表出了 的任意字元 d 數字 d 非數字 代表字串的開始 代表字串的結尾 出現的次數。重複0次或一次 後 懶惰演算法...