正規表示式
說明
[abc]
a、b、c中任意乙個字元
[^abc]
除了a、b、c的任意字元
[a-z]
a、b、c、……、z中的任意乙個字元
[a-za-z0-9]
a~z、a~z、0~9中任意乙個字元
[a-z&&[^bc]]
a~z中除了b和c以外的任意乙個字元,其中&&表示「與」的關係
正規表示式
說明
.
任意乙個字元
\d
任意乙個數字字元,相當於[0-9]
\w
單詞字元,相當於 [ a-za-z0-9_ ]
\s
空白字元,相當於[ \t\n\r ]
\d
非數字字元
\w
非單詞字元
\s
非空白字元
可以利用數量詞約定字元出現的次數
正規表示式
說明x?
表示0個或1個x
x*表示0個或任意多個x
x+表示1個到任意多個x(大於等於1個x)
x表示n個x
x表示n個到任意多個x(大於等於n個x)
x表示n個到 m 個 x
() 圓括號表示分組,可以將一系列正規表示式看做乙個 整體,
^ 匹配開始,$ 匹配結束
案例:匹配8-10個\w 兩種寫法的區別
matches(string regex)
split(string regex)
案例:對乙個字串進行分割,分割符為,加上多個空格
replaceall(string regex,string replacement)
案例:1.對乙個字串中的所有數字進行替換 2.敏感字元過濾
問題:正規表示式中中文如何表示?
unicode編碼來表示中文
[\u4e00-\u9af5]
正規表示式 02
捕獲組也就是pattern中以括號對 分割出的子pattern。至於為什麼要用捕獲組呢,主要是為了能找出在一次匹配中你更關心的部分。group 0 於group 等價,表示整個正規表示式的匹配字串,group 1 等價於第乙個括號內的表示式返回的字串,以此類推。捕獲組可以通過從左到右計算其開括號來編...
正規表示式02
標準字符集 能夠與 多種字元 匹配的表示式 注意區分大小寫,大寫是取補集的意思 d任意乙個數字,0 9中的任意乙個 w任意乙個字母或數字或下劃線,也就是a z,a z,0 9,中任意乙個 s包括空格,製表符,換行符等空白字元中的任意乙個 小數點可以匹配任意乙個字元 除換行符 如果要匹配包括 n 在內...
正規表示式 學習筆記02
re.search 掃整個字串並返回第乙個成功的匹配 content extra stings hello 1234567 world this is a regex demo extra stings result re.match hello.d demo content 從開頭開始匹配 pri...