正規表示式是用來幹嘛的?
匹配 字串的
一、簡介:
就其本質而言,正規表示式是一種小型的、高度專業化的程式語言,他內嵌在python中,並通過re模組實現。正規表示式模式被編譯成一系列的位元組碼,然後由用c編寫的匹配引擎執行。
二、字元匹配(普通字元,元字元)
普通字元:大多數字元和字母都會和自身匹配
元字元1 . # 萬用字元,只能代指任意乙個字元
1 ^ # 尖角符,在字串最開始匹配
1 $ # 匹配物件必須在索引字串最後面
1 * #星號,匹配0-無限的內容
1 + #加號,匹配1-無限的內容
1 ? #問好,匹配0-1次的內容
1 {} #大括號,匹配制定次數的內容
1 #字符集,匹配a或b的內容,並且只能選一,[a-z]:取a-z之間所有字母,[.]可以取消元字元的特殊功能(\ ^ -例外)
[^] #取反值
1 \ # 反斜槓後邊跟元字元去除特殊功能,反斜槓後邊跟普通字元實現特殊功能
\d #匹配任何十進位制數:它相當於[0-9]
\d #匹配任何非數字字元:它相當於[^0-9]
\s #匹配任何空白字元:它相當於[\t\n\r\f\v]
\w #匹配任何字母數字字元
\b #匹配乙個單詞邊界,也就是指單詞和空格之間的位置
compile()
編譯正規表示式模式,返回乙個物件的模式。
match()
從字串的開頭進行匹配,匹配成功就返回乙個匹配物件,匹配失敗就返回none
serach()
函式在字串內查詢模式匹配,只要找到第乙個匹配然後返回,如果字串沒有匹配,則返回none。
findall()
遍歷匹配,可以獲取字串中所有匹配的字串,返回乙個列
finditer()
返回乙個順序訪問每乙個匹配結果的迭代器,周到re匹配的而所有子串,並把它們最為乙個迭代器返回
split()
按照能夠匹配的子串將string分割後返回列表
sub()
使用re替換string中每乙個匹配的子串返回替換後的字串
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...