正規表示式的定義:
正規表示式(regular expression)是一種文字模式,包括普通字元(例如,a 到 z 之間的字母)
和特殊字元(稱為"元字元")。正規表示式使用單個字串來描述、匹配一系列匹配某個句法
規則的字串。
正規表示式的作用:(1)通用的字串表達框架;(2)簡潔表達一組字串的表示式;(3)
針對字串表達「簡潔」和特徵的思想工具;(4)判斷某字串的特徵歸屬。
正規表示式常用於文字處理,通常用於這幾方面:(1)表達文字型別的特徵;(2)同時查詢
或替換一組字串;(3)匹配字串的全部或部分(用的最廣泛)。
正規表示式的使用:編譯,將符合正規表示式語法的字串轉化成正規表示式特徵。
正規表示式的語法:正規表示式語法是由字元和操作符構成。
常用的操作符:
經典例項:
^[a-za-z]+$ 由26個字母組成的字串
^[a-za-z0-9]+$ 由26個字母和0到9數字組成的字串
^-?\d+$ 整數形式字串(複數前面有"-"號)
^[0-9]*[1-9][0-9]*$ 正整數形式字串
[\u4e00-\u9fa5] 匹配中文字元
\d-\d|\d-\d 國內**號碼(前面3位,後面8位,或者前面4位,後面7位)
re庫主要用途為進行字串匹配,用raw string型別(原生字串型別,'\'不解釋為轉義符)來
表達正規表示式(可以使用string型別,但會更繁瑣,因為有的操作符有『\』,因此有轉義符時就
有『\\』)
pattern是正規表示式的字串,string是待匹配的字串,flag是控制標記,常用的三種標記
為re.i,re.m,re.s(功能分別為「忽略正規表示式大小寫,「使正規表示式的給定字元每行的開始
部分(字串有多行時)」,「使正規表示式的'.'操作符能匹配所有字元(除換行外)」)
python正規表示式元字元 正規表示式
字元 描述將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個 向後引用 或乙個八進位制轉義符。例如,n 匹配字元 n n 匹配乙個換行符。序列 匹配 而 則匹配 匹配輸入字串的開始位置。如果設定了 regexp 物件的 multiline 屬性,也匹配 n 或 r 之後的位置。匹配輸入字串的結束...
Python 正規表示式
1.在python中,所有和正規表示式相關的功能都包含在re模組中。2.字元 表示 字串的末尾 如 road 則表示 只有當 road 出現在乙個字串的尾部時才會匹配。3.字元 表示 字元中的開始 如 road 則表示 只有當 road 出現在乙個字串的頭部時才會匹配。4.利用re.sub函式對字串...
Python正規表示式
學習python自然而然就不得不面對正規表示式這個難題。當初在沒有學習python之前,自己也曾經嘗試著學習過正規表示式,但是那時候感覺很麻煩,很難懂,結果就是不了了之。但是現在學習python我用的書是 python基礎教程 第二版 這本書中對re模組的講解很簡單易懂,內容不多但起碼把人領進門了,...