中文正規表示式匹配 正則中文匹配

2021-08-20 09:09:46 字數 1129 閱讀 1862

這篇文章主要講如何使用正則

匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。

\w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下

匹配中文字元的正規表示式: [\u4e00-\u9fa5]
或許你也需要匹配雙位元組字元,中文也是雙位元組的字元

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
注:可以用來計算字串的長度(乙個雙位元組字元長度計2,ascii字元計1)

英文本母:[a-za-z]

數字:[0-9]

匹配中文,英文本母和數字及_:

//code from 

^[\u4e00-\u9fa5_a-za-z0-9]+$

同時判斷輸入長度:·

[\u4e00-\u9fa5_a-za-z0-9_]

^[\w\u4e00-\u9fa5\uf900-\ufa2d]*$

1、乙個正規表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:

^(?!_)(?!.*?_$)[a-za-z0-9_\u4e00-\u9fa5]+$
其中:

^ 與字串開始的地方匹配

(?!_)  不能以_開頭

(?!.*?_$)  不能以_結尾

[a-za-z0-9_\u4e00-\u9fa5]+  至少乙個漢字、數字、字母、下劃線

$  與字串結束的地方匹配

放在程式裡前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-za-z0-9_\u4e00-\u9fa5]+$"

(或者:@"^(?!_)\w*(?2、只含有漢字、數字、字母、下劃線,下劃線位置不限:

^[a-za-z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文本母或者下劃線組成的字串

^\w+$
4、2~4個漢字

@"^[\u4e00-\u9fa5]$";
5、

^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
用:(abc)+ 來分析: xyzabcabcabcxyzabcab

前端開發部落格

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...

常用正規表示式(包括中文匹配)匹配中文正規表示式

常用正規表示式 包括中文匹配 2007 10 24 10 21常用正規表示式 正規表示式用於字串處理 表單驗證等場合,實用高效。現將一些常用的表示式收集於此,以備不時之需。匹配中文字元的正規表示式 u4e00 u9fa5 匹配雙位元組字元 包括漢字在內 x00 xff 應用 計算字串的長度 乙個雙位...

js 正規表示式匹配中文

簡單匹配中文方法 u0000 u00ff 匹配非單位元組字元 另錯誤方法 u00 uff 匹配 非單位元組字元 還包括一些全半形符號如,等 還有vwxyz字元 說明 u0000 u00ff.包含unicode單位元組編碼 0 255編碼 包含基本控制字元和拉丁文本母。採用該否定表示式,粗略判斷是否含...