大學時學的正規表示式,你都餵狗吃了嗎?

2021-08-02 10:10:26 字數 3644 閱讀 2391

使用正規表示式是一種比較常見的檢索或替換字串資訊的方式,很多不太懂正則的朋友,在遇到需要用正則校驗資料時,往往是在網上去找很久,結果找來的還是不很符合要求。

好!那麼問題來了!

問:如何可以快速學會常用的正規表示式的使用?需要背下來嗎?

答:背誦他幹嘛!只有小學生才有背誦全文的作業呢!只要收藏此文,等需要用的時候,直接來查就好了!

一、校驗數字的表示式

數字:^[0-9]*$

n位的數字:^\d$

至少n位的數字:^\d$

m-n位的數字:^\d$

零和非零開頭的數字:^(0|[1-9][0-9]*)$

非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9])?$

帶1-2位小數的正數或負數:^(\-)?\d+(\.\d)?$

正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$

有兩位小數的正實數:^[0-9]+(.[0-9])?$

有1~3位小數的正實數:^[0-9]+(.[0-9])?$

非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*)$ 或 ^\+?[1-9][0-9]*$

非零的負整數:^\-[1-9]0-9"*$ 或 ^-[1-9]\d*$

非負整數:^\d+$ 或 ^[1-9]\d*|0$

非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$

非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

二、校驗字元的表示式

漢字:^[\u4e00-\u9fa5]$

英文和數字:^[a-za-z0-9]+$ 或 ^[a-za-z0-9]$

長度為3-20的所有字元:^.$

由26個英文本母組成的字串:^[a-za-z]+$

由26個大寫英文本母組成的字串:^[a-z]+$

由26個小寫英文本母組成的字串:^[a-z]+$

由數字和26個英文本母組成的字串:^[a-za-z0-9]+$

由數字、26個英文本母或者下劃線組成的字串:^\w+$ 或 ^\w$

中文、英文、數字包括下劃線:^[\u4e00-\u9fa5a-za-z0-9_]+$

中文、英文、數字但不包括下劃線等符號:^[\u4e00-\u9fa5a-za-z0-9]+$ 或 ^[\u4e00-\u9fa5a-za-z0-9]$

可以輸入含有^%&',;=?$\"等字元:[^%&',;=?$\x22]+

禁止輸入含有~的字元:[^~\x22]+

三、特殊需求表示式

網域名稱:[a-za-z0-9][-a-za-z0-9](/.[a-za-z0-9][-a-za-z0-9])+/.?

interneturl:[a-za-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d$

**號碼("***-******x"、"***x-******xx"、"***-******x"、"***-******xx"、"******x"和"******xx):^(\(\d-)|\d-)?\d$

國內**號碼(0511-4405222、021-87888822):\d-\d|\d-\d

身份證號(15位、18位數字):^\d|\d$

短身份證號碼(數字、字母x結尾):^([0-9])(x|x)?$ 或 ^\d|[0-9x]|[0-9x]?$

帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]$

密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-za-z]\w$

強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字元,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[a-z]).$

日期格式:^\d-\d-\d

一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$

乙個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

錢的輸入格式:

i. 有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$

ii. 這表示任意乙個不以0開頭的數字,但是,這也意味著乙個字元"0"不通過,所以我們採用下面的形式:^(0|[1-9][0-9]*)$

iii. 乙個0或者乙個不以0開頭的數字.我們還可以允許開頭有乙個負號:^(0|-?[1-9][0-9]*)$

iv. 這表示乙個0或者乙個可能為負的開頭不為0的數字.讓使用者以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$

v. 必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9])?$

vi. 這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9])?$

vii. 這樣就允許使用者只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9](,[0-9])*(.[0-9])?$

viii. 1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9](,[0-9])*)(.[0-9])?$

備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函式時去掉去掉那個反斜槓,一般的錯誤都在這裡

xml檔案:^([a-za-z]+-?)+[a-za-z0-9]+\\.[x|x][m|m][l|l]$

中文字元的正規表示式:[\u4e00-\u9fa5]

雙位元組字元:[^\x00-\xff] (包括漢字在內,可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1))

空白行的正規表示式:\n\s*\r (可以用來刪除空白行)

html標記的正規表示式:<(\s*?)[^>]*>.*?|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於複雜的巢狀標記依舊無能為力)

首尾空白字元的正規表示式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式)

大學時學的正規表示式,你都餵狗吃了嗎?

大學時學的正規表示式,你都餵狗吃了嗎?使用正規表示式是一種比較常見的檢索或替換字串資訊的方式,很多不太懂正則的朋友,在遇到需要用正則校驗資料時,往往是在網上去找很久,結果找來的還是不很符合要求。好!那麼問題來了!問 如何可以快速學會常用的正規表示式的使用?需要背下來嗎?答 背誦他幹嘛!只有小學生才有...

簡單學正規表示式

前面幾章,講解過正規表示式。這章,我們配合python的re模組,對正規表示式進行總結 其實正規表示式,如果要學會簡單的運用,只要記住下面幾種型別,基本能會使用 1 萬用字元 表示匹配乙個單獨的字元,除了換行符 ython,就能匹配python,ython 2 字符集 表示匹配括號內任意的字元 0 ...

輕鬆學正規表示式

正規表示式廣泛用於查詢 校驗,無論使用什麼語言開發,或者是日常工作中使用編輯器,掌握正規表示式都能帶來效率上的收穫。我在別人的教程中看過一句話 如果你覺得正規表示式很簡單,要麼你是乙個天才,要麼你不是地球人。不要被嚇到,一旦理解正則後,其實也並不會那麼難,而且它給我們帶來的好處是毋庸置疑的。本文盡量...