之前學過一些常用的表示式,稍微熟練一點你就可以發現正規表示式的技巧在**,網上的一些案例也可以看懂。但是對於一些差異化的內容如何去使用正規表示式還是有難度的,也需要我們去探索。
首先是補充一下自己從來不知道的正則匹配規則:
(pattern) :匹配pattern並獲取這一匹配供以後使用,所獲取的匹配可以使用\1、\2等來進行引用。也就是說此模式提供儲存功能。要是有此模式,圓括號要帶上轉義符,如:'\('或者'\)'
(?:pattern) :匹配pattern但不獲取匹配結果,也就是說不提供儲存使用。比如:industr(?:y|ies)就是匹配'industry'或者'industries'兩個單詞
\s :匹配任何空白字元,包括空格、製表符、換頁符、換行符等等,等價於[\f\n\r\t\v]
\s :匹配任何非空白字元,等價於[^ \f\n\r\t\v]
\r :匹配乙個回車符,等價於\x0d和\cm
\v : 匹配乙個垂直製表符。等價於\x0b和\ck
\w : 匹配字母、數字、下劃線等。等價於'[a-za-z0-9_]'
\w : 匹配非祖母、數字、下劃線等,等價於'[^ a-za-z0-9_]'
正規表示式實踐
正規表示式通常用來檢索 替換符合匹配某個模式的文字。字元匹配 代表任意單個字元,乙個字母 數字或漢字等 代表指定範圍內的字元,abc 表示a,b,c 這3個字母中的任意乙個 表示排除 中的字元以外的字元 alnum 所有大小寫字母和數字,數量1 alpha 所有大小寫字母,數量1 blank 代表空...
正規表示式補充學習
search a 查詢 返回的是位置,如果沒有則返回 1 substring 擷取字元 substring 2,5 2位開始,5結束,不包第5 charat 獲取某個字元 charat 0 split 分割字元 正規表示式 js寫法 new regexp a i perl寫法 var a i i 忽...
Python 正規表示式 補充
cuiqingcai大佬 python3 網路爬蟲開發實戰 整理 貪婪與非貪婪 import recontent hello 12345678 word this is a regex demo result re.match he.d demo content print result.group...