正規表示式

2021-09-26 04:47:07 字數 1069 閱讀 7557

正規表示式是用來幹嘛的?

匹配 字串的

一、簡介:

就其本質而言,正規表示式是一種小型的、高度專業化的程式語言,他內嵌在python中,並通過re模組實現。正規表示式模式被編譯成一系列的位元組碼,然後由用c編寫的匹配引擎執行。

二、字元匹配(普通字元,元字元)

普通字元:大多數字元和字母都會和自身匹配

元字元1 . # 萬用字元,只能代指任意乙個字元

1 ^ # 尖角符,在字串最開始匹配

1 $ # 匹配物件必須在索引字串最後面

1 * #星號,匹配0-無限的內容

1 + #加號,匹配1-無限的內容

1 ? #問好,匹配0-1次的內容

1 {} #大括號,匹配制定次數的內容

1 #字符集,匹配a或b的內容,並且只能選一,[a-z]:取a-z之間所有字母,[.]可以取消元字元的特殊功能(\ ^ -例外)

[^] #取反值

1 \ # 反斜槓後邊跟元字元去除特殊功能,反斜槓後邊跟普通字元實現特殊功能

\d #匹配任何十進位制數:它相當於[0-9]

\d #匹配任何非數字字元:它相當於[^0-9]

\s #匹配任何空白字元:它相當於[\t\n\r\f\v]

\w #匹配任何字母數字字元

\b #匹配乙個單詞邊界,也就是指單詞和空格之間的位置

compile()

編譯正規表示式模式,返回乙個物件的模式。

match()

從字串的開頭進行匹配,匹配成功就返回乙個匹配物件,匹配失敗就返回none

serach()

函式在字串內查詢模式匹配,只要找到第乙個匹配然後返回,如果字串沒有匹配,則返回none。

findall()

遍歷匹配,可以獲取字串中所有匹配的字串,返回乙個列

finditer()

返回乙個順序訪問每乙個匹配結果的迭代器,周到re匹配的而所有子串,並把它們最為乙個迭代器返回

split()

按照能夠匹配的子串將string分割後返回列表

sub()

使用re替換string中每乙個匹配的子串返回替換後的字串

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...

正規表示式 表示式

網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...

Linux正規表示式 編寫正規表示式

為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...