簡單匹配中文方法: /[^\u0000-\u00ff]/ (匹配非單位元組字元 )
另錯誤方法:/[^\u00-\uff]/ (匹配 非單位元組字元、還包括一些全半形符號如,.(){}'"!等、還有vwxyz字元)
說明: //u0000-u00ff.包含unicode單位元組編碼( 0-255編碼)包含基本控制字元和拉丁文本母。 採用該否定表示式,粗略判斷是否含有中文。
具體的匹配中文及字元方法:/[\u4e00-\u9fa5\uf900-\ufa2d]/
說明: u4e00-u9fbf : unicode cjk(中日韓)統一表意字元。u9fa5後至u9fbf為空
uf900-ufaff : 為unicode cjk 相容象形文本 。ufa2d後至ufaff為空
//是否含有中文(也包含日文和韓文)
function ischinesechar(str)
//同理,是否含有全形符號的函式
function isfullwidthchar(str)
中文正規表示式匹配 正則中文匹配
這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...
中文正規表示式匹配 正則中文匹配
這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...
php和JS正規表示式匹配中文
一 判斷中文和編碼有關 gbk是雙位元組,utf8是三位元組,可以根據中文的範圍來判斷 編碼範圍 1.gbk gb2312 gb18030 x00 xff gbk雙位元組編碼範圍 x20 x7f ascii xa1 xff 中文 x80 xff 中文 2.utf 8 unicode u4e00 u9...