一前言
本篇文章帶大家快速入門正規表示式的使用,正規表示式的規則不僅適用python語言,基本大多數程式語言都適用,在日常使用中極為廣泛,讀者們有必要學好正規表示式。看完這篇文章,讀者們要理解什麼是正規表示式,正規表示式的規則,常見的正規表示式示例,如何在python中使用函式進行正規表示式操作;
二 正規表示式的概念
正規表示式是指在一串字串中使用特殊的模式匹配獲得子串,我們可以對獲得的子串進行提取,替換等操作;
舉個例子zszxz666 這個字串,現在知識追尋者想要獲得子串zszxz, 則需要經過乙個模式匹配後獲得子串,在正規表示式中這個模式可以很多種格式,知識追尋者在這邊使用最簡單的模式 [a-z]*,然後經過python正規表示式匹配函式就可以獲得子串zszxz;這種方式比平時的字串函式操作更加簡便,適用範圍廣泛;
三 常用的正則匹配模式
常用的正規表示式模式如下,如果對這些模式有疑惑的可以參照 正規表示式手冊 ;手冊中還有日常使用的正則示例,比如使用者名稱,密碼,郵箱,url 的匹配模式等;
group(num=0) 函式表示提取匹配的表示式,可以使用組號提取對應的匹配結果;知識追尋者想要獲得字串中第乙個出現的數字串
import re# 指定模式 至少匹配乙個數字pattern = re.compile(r'd+')# 輸入的字串mat = pattern.match("451zszxz666")# 獲得第乙個匹配到的值g = mat.group();# 451print(g)
知識追尋者想要獲得指定的字串,第乙個匹配的就好;
import re# 想匹配nhzszxz 或者 nh666 或者 nhnhpattern = re.compile(r'nh(zszxz|666|nh)')ser = pattern.search('nhzszxzkkk nh666 llll nhnh')g_0 = ser.group()# zszxzprint(g_0)g_1 = ser.group(1)# nhzszxzprint(g_1)
知識追尋者想要在字串中獲得所有的數字
import repattern = re.compile(r'd+')# 輸入的字串mat = pattern.fidall("451zszxz666")# ['451', '666']print(mat)# 666print(mat[1])
知識追尋者想要獲得所有非數字的子串;
import restr = '8556gfggs5555dfg'# 替換所有數字result = re.sub(r'd', '', str)# gfggsdfgprint(result)
知識追尋者想要獲得以,分割的字串;
import restr = '123,456,zszxz,666'result = re.split(',',str)# ['123', '456', 'zszxz', '666']print(result)
知識追尋者想要獲得數字451,和666;
import repattern = re.compile(r'd+')# 輸入的字串mat = pattern.finditer("451zszxz666")for it in mat: print(it.group())
PHP E mail郵箱正則
1.2.if ereg a z a z0 9 a z0 9 a z0 9 a z0 9 a z a z i email 4.else 7.國際網域名稱格式如下 網域名稱由各國文字的特定字符集 英文本母 數字及 即連字元或減號 任意組合而成,但開頭及結尾均不能含有 不能連續出現。網域名稱中字母不分大小...
php email郵箱正則驗證
國際網域名稱格式如下 網域名稱由各國文字的特定字符集 英文本母 數字及 即連字元或減號 任意組合而成,但開頭及結尾均不能含有 不能連續出現 網域名稱中字母不分大小寫。網域名稱最長可達60個位元組 包括字尾.com net org等 a z a z0 9 a z0 9 a z0 9 a z0 9 a ...
php email郵箱正則驗證
國際網域名稱格式如下 網域名稱由各國文字的特定字符集 英文本母 數字及 即連字元或減號 任意組合而成,但開頭及結尾均不能含有 不能連續出現 網域名稱中字母不分大小寫。網域名稱最長可達60個位元組 包括字尾.com net org等 a z a z0 9 a z0 9 a z0 9 a z0 9 a ...