正規表示式筆記

2021-08-21 21:35:23 字數 779 閱讀 4666

基本:

^為匹配輸入字串的開始位置

$為匹配輸入字串的結束位置

[0-9]代指所有數字 等價於\d

[a-z]代指所有小寫字母

[a-z]代指所有大寫字母

[a-za-z]代指所有字母

[abc]字元集合,匹配所包含的任意乙個字元

\w 匹配數字字母下劃線

+ 代表前面的字元必須至少出現一次(1次或多次)等價於

* 代表前面的字元可以不出現,也可以出現一次或者多次(0次、或1次、或多次)等價於

? 代表前面的字元最多隻可以出現一次(0次、或1次)等價於

( ) 標記乙個子表示式的開始和結束位置。子表示式可以獲取供以後使用

. 匹配除換行符 \n 之外的任何單字元

[ 標記乙個中括號表示式的開始

或  或  共6種。

表示匹配確定的n次

表示至少匹配n次

表示最少匹配n次,最多匹配m次

定位符:

定位符用來描述字串或單詞的邊界,^ 和 $ 分別指字串的開始與結束,\b 描述單詞的前或後邊界,\b 表示非單詞邊界。

(^[0-9])+ 匹配乙個或多個含數字的字串組合

[^[0-9]]+ 匹配乙個或多個不含有數字的字串組合

*和+都是貪婪的,因為它們會盡可能多的匹配字元,在它們的後面加上乙個?就可以改為非貪婪或最小匹配。

不能將限定符和定位符一起使用

正規表示式 正規表示式函式 筆記

筆記直接使用pycharm製作,需要原始檔請私聊。正規表示式函式 1.match 2.search 3.全域性匹配函式 全域性匹配 re.compile 正規表示式 findall 資料 import re string poythonydasadcasa pat2 p.y 懶惰模式執行 較精準 r...

正規表示式筆記

不同的語系編碼的順序不一樣 lang c 0 1 2 3 a b c d z a b c d z lang zh cn 0 1 2 3 4 a a b b c c z z 使用正規表示式時,需要留意環境的語系是什麼,否則會有不同的結果 alnum 英文大小寫字元及數字 0 9 a z a z alp...

正規表示式筆記

d 0 9中的任意乙個數字 w a z,a z,0 9,中的任意乙個,即字母數字下劃線 s 空格,製表符,換頁符等空白字元的其中任意乙個 小數點可以匹配換行符 n 以外的任意乙個字元 匹配某範圍內的任意乙個字元 ab9 匹配 a b 9 中的任意乙個 abc 匹配abc之外的任意乙個字元 a g 匹...