由於有些字符集很常用,所以正規表示式本身就提供了對這類字符集的簡寫如上圖所示,
\s、\s、\d、\d、\w、\w
這六個字符集在平時是很常用的,->左邊兩邊的正則,一般情況下,表示的含義是一樣的,也就是等價的。也許你已經發現了,
\s
和\s
只是字母大小寫的區別,代表的字符集就變成相反的了。\s
和\s
是沒有交集的,但它們是互補的,兩個組合起來,剛好是乙個表示所有字元的全集[\s\s]
。\d 等價於 [0-9],表示匹配任意乙個數字
\w
等價於[a-za-z0-9_]
,表示匹配任意乙個數字、字母或下劃線
\s
等價於[ \t\r\n\f]
,表示匹配任意乙個空格、製表符、換行或換頁符
\d
等價於[^0-9]
,跟\d
相反
\w
等價於[^a-za-z0-9_]
,跟\w相反
\s
等價於[^ \t\r\n\f]
,跟\s
相反簡寫的字符集也可以放到方括號
裡面,表示的還是它原來的字符集,例如
\d
可以寫成[\d]
,\w
可以寫成[\w]
,\s
可以寫成[\s]
。也可以這麼寫[\d\s]
,表示匹配任意乙個數字或空白符。而[^\d\s]
跟[\d\s]
是等價的,表示的是匹配任意乙個非數字或非空白符。常用字符集的總結
ascii編碼 主要包括26字母,數字符號,和一些常用符號,用乙個位元組足夠 1個位元組可以表示2 8 256種字元 實際上,這些字元只使用了1個位元組的7位。其中0 127最高位是0,另外128個擴充套件的ascii碼,最高位都是1。它是最通用的單位元組編碼系統。iso8859 1 通常叫做lat...
常用字符集編碼格式詳解
ascii ascii碼是7位編碼,編碼範圍是0x00 0x7f。ascii字符集包括英文本母 阿拉伯數字和標點符號等字元。其中0x00 0x20和0x7f共33個控制字元。只支援ascii碼的系統會忽略每個位元組的最高位,只認為低7位是有效位。hz字元編碼就是早期為了在只支援7位ascii系統中傳...
正規表示式常用字符集
行首匹配 0或1個 0或多個 1或多個 將下乙個字元標記為乙個特殊字元 或乙個原義字元 或乙個向後引用 或乙個八進位制轉義符。例如,n 匹配乙個換行符,匹配 而 則匹配 匹配輸入字串的結束位置。如果設定了regexp 物件的 multiline 屬性,也匹配 n 或 r 之前的位 除 n 之外的任何...