正規表示式補充學習

2021-06-17 18:07:43 字數 950 閱讀 6304

search('a') 查詢 返回的是位置,如果沒有則返回-1

substring 擷取字元 substring(2,5) 2位開始,5結束,不包第5

charat 獲取某個字元 charat(0)

split 分割字元

正規表示式 js寫法:new regexp('a','i') perl寫法:var=/a/i;

i 忽略大小寫 如:var reg=/a/i;

g 找到全部 如:var reg=/abcsaaa/g

+ 若干 任意個

.任意字元

範圍[abc]方括號內隨便選哪個都行

[a-z0-9]a到z 0到9

[^a-z] ^排除,除了不少英文本母

^不在方括號內就是表示行首

$不在方括號內就是表示行尾

量詞:正好出現n次

最少n次,最多m次

最少n次,最多不限

?最少0次,最多1次

轉義:\d 數字[0-9]

\w 英文、數字、下劃線[a-z0-9_]

\s空白字元

\d [^0-9]

\w [^a-z0-9_]

\s 非空白字元

match:把所有匹配的東西提取出來

replace:替換

test:檢驗是否符合正規表示式的規則,有一部分符合就返回true

例如:

^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

解釋

^是匹配的字元開頭,

\w匹配的是字母,數字,下劃線,漢字,

+是匹配一次或多次(就是最少一次),

\.是匹配的 . (因為.在正則中匹配除換行符以外的任意字元),所以如果需要.在字串中出現的話就加乙個\ ,這個是轉義符

*匹配的是重複零次或更多次

@是匹配字串中必須出現的字元

$是字串結尾

Python 正規表示式 補充

cuiqingcai大佬 python3 網路爬蟲開發實戰 整理 貪婪與非貪婪 import recontent hello 12345678 word this is a regex demo result re.match he.d demo content print result.group...

正規表示式使用補充

doctype html html lang zh cn head meta charset utf 8 title title title head body h2 正規表示式 h2 p 工作時 如果有對於字串的 檢索 想到正規表示式 看語法 手機號驗證 郵箱驗證 p body html scri...

Python爬蟲 正規表示式補充

一.正規表示式 正規表示式 regular expression,簡稱regex或re 又稱為正規表示法或常規表示法,常常用來檢索 替換那些符合某個模式的文字,它首先設定好了一些特殊的字及字元組合,通過組合的 規則字串 來對表示式進行過濾,從而獲取或匹配我們想要的特定內容。它具有靈活 邏輯性和功能性...