正規表示式概述
正規表示式,⼜稱正規表示式、正規表示法、正規表示式、規則表示式、常 規表示法(英語:regular expression,在**中常簡寫為regex、regexp或 re),是電腦科學的⼀個概念。正規表示式使⽤單個字串來描述、匹配 ⼀系列匹配某個句法規則的字串。在很多⽂本編輯器⾥,正規表示式通常 被⽤來檢索、替換那些匹配某個模式的⽂本。
regular expression的「regular」⼀般被譯為「正則」、「正規」、「常規」。此處 的「regular」即是「規則」、「規律」的意思,regular expression即「描述某種規則 的表示式」之意。
re模組操作
在python中需要通過正規表示式對字串進⾏匹配的時候,可以使⽤⼀個模 塊,名字為re
re模組的使⽤過程
#coding=utf-8
# 導⼊re模組
import re
# 使⽤match⽅法進⾏匹配操作
result = re.match(正規表示式,要匹配的字串)
# 如果上⼀步匹配到資料的話,可以使⽤group⽅法來提取資料
result.group()
123
4567
re.match是⽤來進⾏正則匹配檢查的⽅法,若字串匹配正則 表示式,則match⽅法返回匹配物件(match object),否則 返回none(注意不是空字串"")。
匹配物件macth object具有group⽅法,⽤來返回字串的匹 配部分。
2. re模組示例(匹配以itcast開頭的語句)
#coding=utf-8
import re
result = re.match(「itcast」,「itcast.cn」)
re模組操作
result.group()
運⾏結果為:
itcast
3. 說明
re.match() 能夠匹配出以***開頭的字串
表示字元
字元 功能
. 匹配任意1個字元(除了\n)
[ ] 匹配[ ]中列舉的字元
\d 匹配數字,即0-9
\d 匹配⾮數字,即不是數字
\s 匹配空⽩,即 空格,tab鍵
\s 匹配⾮空⽩
\w 匹配單詞字元,即a-z、a-z、0-9、_
\w 匹配⾮單詞字元
表示數量
匹配多個字元的相關格式
字元 功能
? 匹配前⼀個字元出現1次或者0次,即要麼有1次,要麼沒有
匹配前⼀個字元出現m次
匹配前⼀個字元⾄少出現m次
匹配前⼀個字元出現從m到n次
表示邊界
字元 功能
^ 匹配字串開頭
$ 匹配字串結尾
\b 匹配⼀個單詞的邊界
\b 匹配⾮單詞邊界
匹配分組
字元 功能
| 匹配左右任意⼀個表示式
(ab) 將括號中字元作為⼀個分組
\num 引⽤分組num匹配到的字串
(?p) 分組起別名
(?p=name) 引⽤別名為name分組匹配到的字串
python貪婪和⾮貪婪
python⾥數量詞預設是貪婪的(在少數語⾔⾥也可能是預設⾮貪婪),總是 嘗試匹配盡可能多的字元;
⾮貪婪則相反,總是嘗試匹配盡可能少的字元。
在"*","?","+",""後⾯加上?,使貪婪變成⾮貪婪。
re模組操作
在python中需要通過正規表示式對字串進⾏匹配的時候,可以使⽤⼀個模 塊,名字為re
re模組的使⽤過程
#coding=utf-8
# 導⼊re模組
import re
# 使⽤match⽅法進⾏匹配操作
result = re.match(正規表示式,要匹配的字串)
# 如果上⼀步匹配到資料的話,可以使⽤group⽅法來提取資料
result.group()
123
4567
re.match是⽤來進⾏正則匹配檢查的⽅法,若字串匹配正則 表示式,則match⽅法返回匹配物件(match object),否則 返回none(注意不是空字串"")。
匹配物件macth object具有group⽅法,⽤來返回字串的匹 配部分。
2. re模組示例(匹配以itcast開頭的語句)
#coding=utf-8
import re
result = re.match(「itcast」,「itcast.cn」)
re模組操作
result.group()
運⾏結果為:
itcast
3. 說明
re.match() 能夠匹配出以***開頭的字串
表示字元
字元 功能
. 匹配任意1個字元(除了\n)
[ ] 匹配[ ]中列舉的字元
\d 匹配數字,即0-9
\d 匹配⾮數字,即不是數字
\s 匹配空⽩,即 空格,tab鍵
\s 匹配⾮空⽩
\w 匹配單詞字元,即a-z、a-z、0-9、_
\w 匹配⾮單詞字元
表示數量
匹配多個字元的相關格式
字元 功能
? 匹配前⼀個字元出現1次或者0次,即要麼有1次,要麼沒有
匹配前⼀個字元出現m次
匹配前⼀個字元⾄少出現m次
匹配前⼀個字元出現從m到n次
表示邊界
字元 功能
^ 匹配字串開頭
$ 匹配字串結尾
\b 匹配⼀個單詞的邊界
\b 匹配⾮單詞邊界
匹配分組
字元 功能
| 匹配左右任意⼀個表示式
(ab) 將括號中字元作為⼀個分組
\num 引⽤分組num匹配到的字串
(?p) 分組起別名
(?p=name) 引⽤別名為name分組匹配到的字串
python貪婪和⾮貪婪
python⾥數量詞預設是貪婪的(在少數語⾔⾥也可能是預設⾮貪婪),總是 嘗試匹配盡可能多的字元;
⾮貪婪則相反,總是嘗試匹配盡可能少的字元。
在"*","?","+",""後⾯加上?,使貪婪變成⾮貪婪。
正規表示式概述
正規表示式,稱正規表示式 正規表示法 正規表示式 規則表示式 常 規表示法 英語 regular expression,在 中常簡寫為regex regexp或 re 是電腦科學的 個概念。正規表示式使 單個字串來描述 匹配 系列匹配某個句法規則的字串。在很多 本編輯器 正規表示式通常 被 來檢索 ...
概述正規表示式
昨天在牛客網刷試題的時候有一道關於較複雜的正規表示式,一臉懵逼,所以想著今天總結整理一下。然後在github上看了看,這篇不錯 github上關於正規表示式的介紹 1 正規表示式是什麼 正規表示式是一組由字母和符號組成的特殊文字,它可以用來從文字中找出滿足你想要的格式的句子.2 基本匹配 正規表示式...
正規表示式概述 什麼是正規表示式
正規表示式概述 正規表示式在程式語言中存在著廣泛的應用,特別是用來處理字串。如匹配字串 查詢字串 替換字串等。可以說,正規表示式是一段文字或乙個公式,它是用來描述用某種模式去匹配一類字串的公式,並且該公式具有一定的模式。本小節將介紹正規表示式的基本概念 第乙個正規表示式,以及測試正規表示式的工具co...