正規表示式主要應用於對特殊或一般的長字串特定子串的提取或處理
由於正規表示式用法過多,暫時標註常用用法,其他的如遇到用下方鏈結查詢
部落格–正則
菜鳥教程–正規表示式
import re 引入正規表示式的庫函式
1.re.findall(str,string)
search函式用法相同但是查詢到第乙個就返回,並返回乙個match物件,
在應用find all函式時一般要將str前加r進行轉義處理(具體含義後續補充)
str 需要匹配的子串
string母串
最後返回所有匹配成功的值在列表中
2. . 可以匹配乙個任意字元(不包括換行),如果想要用其匹配換行符,需要在find all表示式形成第三個引數,re.s
3.在一般情況下自己定義返回串字首是小寫,故應在第三個引數加re.i ,如果第三引數有多個引數的情況下使用|分開
4. *代表匹配它前面的子串任意次,但凡母串中含有前面的字元後面都將含有
5. *?代表非貪婪匹配按最少的情況匹配 主要目的是為了防止後續處理過程中有類似的重複項,進而影響資訊提取
6.()將括號內匹配到的字元返回到列表,主要應用與爬蟲的url或者關鍵字的提取,鏈結的提取。
7.「%s%s」%(str1,str2)用於兩個字串的拼接,不需要強制轉換,因為其中有乙個是字串但不是其形式的
正規表示式 正規表示式 總結
非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...
正規表示式 表示式
網域名稱 a za z0 9 a za z0 9 a za z0 9 a za z0 9 interneturl a za z s 或 http w w w 手機號碼 13 0 9 14 5 7 15 0 1 2 3 5 6 7 8 9 18 0 1 2 3 5 6 7 8 9 d 號碼 x x x...
Linux正規表示式 編寫正規表示式
為了所有實用化的用途,你可以通過使用程式產生正確的結果。然而,並不意味著程式總是如你所願的那樣正確地工作。多數情況下,如果程式不能產生想要的輸出,可以斷定真正的問題 排除輸入或語法錯誤 在於如何描述想要的東西。換句話說,應該考慮糾正問題的地方是描述想要的結果的表示式。表示式不完整或者公式表示得不正確...