python正則re表示式的定義和規則

2021-10-07 11:45:42 字數 1295 閱讀 6719

# 正規表示式的定義和規則

''''

正規表示式,就是使用字元,轉義字元和特殊字元組成乙個規則,

使用這個規則對文字的內容完成乙個搜尋或匹配或替換的功能

正規表示式的組成

普通字元:大小寫字母,數字,組合。。。

轉義字元:\w \w \d \d \s \s...

特殊字元:. * ? + ^ $ {} ()

匹配模式:i u 。。。

'''import re

# 普通字元

# vars = '123456abcdefg'

# reg = 'ab'

# res = re.search(reg, vars).group()

# print(res)

# 轉移字元

# \w 單個字母,數字,下劃線

# \w 單個 非 字母,數字,下劃線

# \d 單個的數字

# \d 單個 非 的數字

# \s 單個 空格符或製表符

# \s 單個 非 空格符或製表符

# vars = 'abc123abcde12345'

# reg = '\s'

# res = re.search(reg, vars).group()

# print(res)

# 特殊字元

# . 單個的任意字元,除了換行符之外

# * 代表匹配次數 任意次數(包括零次)

# 特點:如果使用*號,那麼在匹配的開始處如果符合要求,

# 則按照規則一直向後匹配,直到不符合規則結束並把前面符合的資料返回

# 如果在匹配的開始處就不符合要求,則直接返回,匹配到的次數為0

# + 代表匹配次數 至少要求匹配一次

# ? '\d+?' 拒絕貪婪,就是前面的匹配規則只要達成則返回

# {} 指定匹配次數 必須匹配三次 必須匹配2到5次

# 代表字元的範圍 [a-z,0-9,_]

# () 代表子組,括號中的表示式首先作為整個正則的一部分,另外會把符合小括號的內容單獨提取

# ^ 代表開頭

# $ 代表結尾 '^1\d$'

# vars = 'abc123abcde12345'

# reg = '\d'

# res = re.search(reg, vars).group()

# print(res, len(res))

# 正則模式

# re.i 不區分大小寫

# 。。。

# 。。。

python 正規表示式 re

match 和 search 的區別 match是從字串開頭匹配,而search是在整個字串中匹配。如 p re.compile a z p.match message none 因為開頭是 因此無法匹配 而 m p.search message print m re.matchobject ins...

python正規表示式 re

re.match 嘗試從字串的開始匹配乙個模式,如 下面的例子匹配第乙個單詞。import retext jgood is a handsome boy,he is cool,clever,and so on.m re.match r w s text ifm print m.group 0 n m...

python正規表示式(re)

在python中re模組用於對正規表示式 regular expression 的支援。正規表示式是可以匹配文字片段的模式。一 正規表示式的書寫 1 萬用字元 點 可以匹配任何字元 除了換行符 如 ike 可以匹配 bike like 等 2 對特殊字元進行轉義 在正規表示式中如果是引用特殊字元作為...