正則的概念:
根據指定規則從字串中提取子字串
指定規則:正規表示式
字串:待匹配的字串
子字串:匹配結果
注意點:正則並不是python獨有的,各種語言均可以使用正則
整則表示式應用場景:
表單驗證(手機號驗證、賬號驗證、密碼驗證)
爬蟲其他
正規表示式的語法:
匹配單個字元:
.(點):匹配任意字元,換行符除外
字元組,一些特殊的字元組 [a-z] [a-z] [0-9]
\d:匹配的任意數字
\d: 匹配非數字
\w:匹配數字字母下劃線
\w: 匹配非數字字母下劃線。
\s:匹配空白符
\s:匹配的是非空白符
^: 以什麼字元開頭
$:以什麼字元結尾
多個字元(匹配多個字元)量詞:
*:匹配0個或者無數個
+:匹配1次或者無數個
?:匹配1個或者0個
:匹配m個
:匹配n個到m個
:匹配至少m個
:匹配至多m個
貪婪匹配和非貪婪
正規表示式預設是貪婪模式
要想變維不貪婪,需要在量詞後面使用?進行修飾
分組與或:
分組:是在正規表示式中使用()將正規表示式的一部分表示
作用:改變優先順序;分組使用;分組捕獲
或 |:
用"|" 分隔的表示式,代表 | 兩邊的正規表示式進行匹配,兩邊的都可以
**實現:
注意:使用時先導入模組re
匹配單個字元:
匹配多個字元:
匹配開頭和結尾:
匹配分組:
總結:
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...