search('a') 查詢 返回的是位置,如果沒有則返回-1
substring 擷取字元 substring(2,5) 2位開始,5結束,不包第5
charat 獲取某個字元 charat(0)
split 分割字元
正規表示式 js寫法:new regexp('a','i') perl寫法:var=/a/i;
i 忽略大小寫 如:var reg=/a/i;
g 找到全部 如:var reg=/abcsaaa/g
+ 若干 任意個
.任意字元
範圍[abc]方括號內隨便選哪個都行
[a-z0-9]a到z 0到9
[^a-z] ^排除,除了不少英文本母
^不在方括號內就是表示行首
$不在方括號內就是表示行尾
量詞:正好出現n次
最少n次,最多m次
最少n次,最多不限
?最少0次,最多1次
轉義:\d 數字[0-9]
\w 英文、數字、下劃線[a-z0-9_]
\s空白字元
\d [^0-9]
\w [^a-z0-9_]
\s 非空白字元
match:把所有匹配的東西提取出來
replace:替換
test:檢驗是否符合正規表示式的規則,有一部分符合就返回true
例如:
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
解釋
^是匹配的字元開頭,\w匹配的是字母,數字,下劃線,漢字,
+是匹配一次或多次(就是最少一次),
\.是匹配的 . (因為.在正則中匹配除換行符以外的任意字元),所以如果需要.在字串中出現的話就加乙個\ ,這個是轉義符
*匹配的是重複零次或更多次
@是匹配字串中必須出現的字元
$是字串結尾
Python 正規表示式 補充
cuiqingcai大佬 python3 網路爬蟲開發實戰 整理 貪婪與非貪婪 import recontent hello 12345678 word this is a regex demo result re.match he.d demo content print result.group...
正規表示式使用補充
doctype html html lang zh cn head meta charset utf 8 title title title head body h2 正規表示式 h2 p 工作時 如果有對於字串的 檢索 想到正規表示式 看語法 手機號驗證 郵箱驗證 p body html scri...
Python爬蟲 正規表示式補充
一.正規表示式 正規表示式 regular expression,簡稱regex或re 又稱為正規表示法或常規表示法,常常用來檢索 替換那些符合某個模式的文字,它首先設定好了一些特殊的字及字元組合,通過組合的 規則字串 來對表示式進行過濾,從而獲取或匹配我們想要的特定內容。它具有靈活 邏輯性和功能性...