注意pattern字串前要加r 原始字串
元字元. 匹配除換行的任意字元
^ 匹配開頭
$ 匹配結尾
表示重複
星號 匹配0-多次
+ 匹配1到多次
? 匹配0次或1次
匹配m次至n次
後面跟乙個?表示非貪婪匹配
[ab] 取乙個(一般元字元在其中是普通字元)
中的元字元
-在其中表示至
^表示非
\d類似的
() 表示分組
| 分組內的或
\1 後面跟元字元轉義
2 後面跟普通字元實現特殊功能
\d [0-9]
\d [^0-9]
\s 任何空白字元 [\t\n\r\f\v]
\s 任意非空白字元
\w [0-9a-za-z_]
\w [^0-9a-za-z_]
\b 匹配乙個單詞邊界,指單詞到空格處
\b 匹配非單詞邊界
3 引用序號對應的字組,相當於把小括號的內容放倒此處
函式re.findall(pattern, string) 找到之後返回符合組的列表,組開頭有?:則返回整個
re.search(pattern, string) 只找到乙個.返回乙個match物件 .group()返回字串
re.match(pattern, string) 只在開頭匹配,返回乙個match物件.group()返回字串
re.compile(pattern) 多次使用乙個正則時,有必要生成乙個物件
re.finditer(pattern, string) 返回乙個可迭代物件,每個元素是match物件
re.sub(pattern, repl, string, count=0) 替換count個,0為所有
re.subn(pattern, repl, string) 功能同上,返回乙個元組(替換完的字串,替換次數)
re.split(pattern, string)
以上函式都有引數,編譯標識 flags
re.i 匹配對大小寫不敏感
re.s 使.包含換行在內的所有字元
match物件的方法
group() 返回匹配到的字串
start() 返回匹配到的起始位置
end() 返回匹配到的結束位置
span() 返回乙個元組,(起始偏移,結束偏移)
group(數字) 返回第幾個組
Python正規表示式小結
python正規表示式總結 1.了解正規表示式 正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元 及這些特定字元的組合,組成乙個 規則字串 這個 規則字串 用來表達對字串的一種過濾邏輯。正規表示式是用來匹配字串非常強大的工具,在其他程式語言中同樣有正規表示式的概念,python同...
python小結 python小結
c python33新增到你的path 環境變數中,你可以在dos 視窗中 輸入以下命令 set path path c python33 id 方法的返回值就是物件的記憶體位址。在 行 首行 後插入至少一行特殊的注釋行來定義原始檔的編碼。coding encoding sys.modules 模組...
Python正規表示式小結 1
學習一段python 正規表示式了,對 match search findall finditer 等函式作一小結 下面以一段網頁為例,用python 正規表示式作乙個範例 strhtml print strhtml 正規表示式 匹配如 a href xx class x remod re.comp...