其實是用來操作字串的一些規則。其實更多是用正則解決字串操作的問題。
好處
正則的出現,對字串的複雜操作變得更為簡單。
特點
將對字串操作的**用一些符號來表示。只要使用了指定符號,就可以呼叫底層的**對字串進行操作。符號的出現,簡化了**的書寫。
弊端
符號的出現雖然簡化了書寫,但是卻降低了閱讀性。
組
用小括號標示,每定義乙個小括號,就是乙個組,而且有自動編號,從1開始。
只要使用組,對應的數字就是使用該組的內容。別忘了,陣列要加\\。
(aaa(wwww(ccc))(eee))技巧,從左括號開始數即可。有幾個左括號就是幾組。
匹配其實用的就是string類中的matches方法。
string reg = "[1-9][0-9]";
boolean b = qq.matches(reg);//將正則和字串關聯對字串進行匹配。
切割其實用的就是string類中的split方法。
替換其實用的就是string類中的replaceall();
獲取先要將正規表示式編譯成正則物件。使用的是pattern中靜態方法 compile(regex);
通過pattern物件獲取matcher物件。
pattern用於描述正規表示式,可以對正規表示式進行解析。
而將規則操作字串,需要從新封裝到匹配器物件matcher中。
然後使用matcher物件的方法來操作字串。
如何獲取匹配器物件呢?
通過pattern物件中的matcher方法。該方法可以正則規則和字串想關聯。並返回匹配器物件。
使用matcher物件中的方法即可對字串進行各種正則操作。
校驗數字的表示式01 數字:^[0-9]*$
02 n位的數字:^\d$
03 至少n位的數字:^\d$
04 m-n位的數字:^\d$
05 零和非零開頭的數字:^(0|[1-9][0-9]*)$
06 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9])?$
07 帶1-2位小數的正數或負數:^(\-)?\d+(\.\d)?$
08 正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$
09 有兩位小數的正實數:^[0-9]+(.[0-9])?$
10 有1~3位小數的正實數:^[0-9]+(.[0-9])?$
11 非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*)$ 或 ^\+?[1-9][0-9]*$
12 非零的負整數:^\-[1-9]0-9"*$ 或 ^-[1-9]\d*$
13 非負整數:^\d+$ 或 ^[1-9]\d*|0$
14 非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
校驗字元的表示式01 漢字:^[\u4e00-\u9fa5]$
02 英文和數字:^[a-za-z0-9]+$ 或 ^[a-za-z0-9]$
03 長度為3-20的所有字元:^.$
04 由26個英文本母組成的字串:^[a-za-z]+$
05 由26個大寫英文本母組成的字串:^[a-z]+$
06 由26個小寫英文本母組成的字串:^[a-z]+$
07 由數字和26個英文本母組成的字串:^[a-za-z0-9]+$
08 由數字、26個英文本母或者下劃線組成的字串:^\w+$ 或 ^\w$
09 中文、英文、數字包括下劃線:^[\u4e00-\u9fa5a-za-z0-9_]+$
10 中文、英文、數字但不包括下劃線等符號:^[\u4e00-\u9fa5a-za-z0-9]+$ 或 ^[\u4e00-\u9fa5a-za-z0-9]$
11 可以輸入含有^%&',;=?$\"等字元:[^%&',;=?$\x22]+
12 禁止輸入含有~的字元:[^~\x22]+
特殊需求表示式
02 網域名稱:[a-za-z0-9][-a-za-z0-9](/.[a-za-z0-9][-a-za-z0-9])+/.?
03 interneturl:[a-za-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
04 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d$
05 **號碼("***-******x"、"***x-******xx"、"***-******x"、"***-******xx"、"******x"和"******xx):^(\(\d-)|\d-)?\d$
06 國內**號碼(0511-4405222、021-87888822):\d-\d|\d-\d
07 身份證號(15位、18位數字):^\d|\d$
08 短身份證號碼(數字、字母x結尾):^([0-9])(x|x)?$ 或 ^\d|[0-9x]|[0-9x]?$
09 帳號是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]$
10 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-za-z]\w$
11 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字元,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[a-z]).$
12 日期格式:^\d-\d-\d
13 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 乙個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15 錢的輸入格式:
16 1.有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
17 2.這表示任意乙個不以0開頭的數字,但是,這也意味著乙個字元"0"不通過,所以我們採用下面的形式:^(0|[1-9][0-9]*)$
18 3.乙個0或者乙個不以0開頭的數字.我們還可以允許開頭有乙個負號:^(0|-?[1-9][0-9]*)$
19 4.這表示乙個0或者乙個可能為負的開頭不為0的數字.讓使用者以0開頭好了.把負號的也去掉,因為錢總不能是負的吧.下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
20 5.必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9])?$
21 6.這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9])?$
22 7.這樣就允許使用者只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9](,[0-9])*(.[0-9])?$
23 8.1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9](,[0-9])*)(.[0-9])?$
24 備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字串也可以接受的話(奇怪,為什麼?)最後,別忘了在用函式時去掉去掉那個反斜槓,一般的錯誤都在這裡
25 xml檔案:^([a-za-z]+-?)+[a-za-z0-9]+\\.[x|x][m|m][l|l]$
26 中文字元的正規表示式:[\u4e00-\u9fa5]
27 雙位元組字元:[^\x00-\xff] (包括漢字在內,可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1))
28 空白行的正規表示式:\n\s*\r (可以用來刪除空白行)
29 html標記的正規表示式:<(\s*?)[^>]*>.*?|<.*? /> (網上流傳的版本太糟糕,上面這個也僅僅能部分,對於複雜的巢狀標記依舊無能為力)
30 首尾空白字元的正規表示式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等),非常有用的表示式)
使用快捷鍵"ctrl+f"開啟myeclipse的查詢替換功能
勾選regular expressions
這樣就可以把**中的行號全部去掉
去除**行號的正規表示式:^\s*\d+\.
去除注釋** \/\*(\s|.)*?\*\/
Java正規表示式
正規表示式結構簡介 字元 x 字元 x 反斜槓 0n 十進位制數 0 n 7 0nn 十進位制數 0nn 0 n 7 0mnn 十進位制數 0mnn 0 m 3,0 n 7 xhh 十六進製制數 0xhh uhhhh 十六進製制數 0xhhhh t 製表符 u0009 n 換行符 u000a r 回...
Java正規表示式
方便查詢的東西 基本語法 轉義字元 in d d d 數字0 9 多少到多少 d 非數字 0 9 非 w 單詞字元 a za z0 9 a3 w 非單詞字元 w s 空白 如 n t 0 1次 1 n次 0 n次 必須是n次 大於等於n次 n demo 中文 u0391 uffe5 英文 a za ...
Java正規表示式
舉例說明 the 開頭一定要有 the 字串 of despair 結尾一定要有 of despair 的字串 那麼,abc 就是要求以abc開頭和以abc結尾的字串,實際上是只有abc匹配。notice 匹配包含notice的字串。你可以看見如果你沒有用我們提到的兩個字元 最後乙個例子 就是說 模...