這裡針對ascii、unicode、utf8三種編碼方式簡介一下。
ascii編碼,我們選擇常用的gb2312字符集查詢,相同的文字,不同的字符集對應的字元編碼也不一樣,我們以「道」字為例,在gb2312碼表查詢到如下
21 0 1 2 3 4 5 6 7 8 9
0 怠 耽 擔 丹 單 鄲 撣 膽 旦
1 氮 但 憚 淡 誕 彈 蛋 當 擋 黨
2 蕩 檔 刀 搗 蹈 倒 島 禱 導 到
3 稻 悼 道 盜 德 得 的 蹬 燈 登
4 等 瞪 凳 鄧 堤 低 滴 迪 敵 笛
5 狄 滌 翟 嫡 抵 底 地 蒂 第 帝
6 弟 遞 締 顛 掂 滇 碘 點 典 靛
7 墊 電 佃 甸 店 惦 奠 澱 殿 碉
8 叼 雕 凋 刁 掉 吊 釣 調 跌 爹
9 碟 蝶 迭 諜 疊
「道」在21區,32位,所以它的區位碼為2132,轉換成16進製為1520。1520 + a0a0 = b5c0,最終b5c0就是「道」在ascii編碼gb2312字符集下的編碼,在vs中賦值「道」給字串,在記憶體中檢視,它的值就是b5c0。
unicode編碼,「道」字查詢碼表為9040 + 14 - 1 = 9053,如下表所示,「道」的unicode字元在記憶體中就是9053。
0001
0203
0405
0607
0809
0a0b
0c0d
0e0f
1011
1213
1415
1617
1819
1a1b
1c1d
1e1f
9000退送
適逃逄逅
逆逇逈選
遜逋逌逍
逎透逐逑
遞逓途逕
逖逗逘這
通逛逜逝
逞速cjk9020造逡
逢連逤逥
邐逧逨逩
逪逫逬逭
逮逯逰周
進逳逴逵
逶逷逸逹
逺邏逼逽
逾逿9040遀遁
遂遃遄遅
遆遇遈遉
遊運遌遍
過遏遐遑
遒道達違
遖遺遘遙
遚遛遜遝
遞遟utf8編碼,與unicode編碼可以互相推算出來
道的unicode編碼為9053,換算成二進位制
1001 0000 0101 0011
加上1110 0000 10 000000 10 000000
得到1110 1001 1000 0001 1001 0011 ,轉換成16進製為e9 81 93,所以「道」的utf8編碼就是e98193。同理可以從utf8反過來推算unicode編碼。
如何判別檔案的字元編碼以及變換字元編碼?
如果是linux環境 可以使用nkf 當然要先判斷有沒有裝這個命令 where is nkf nkf使用方法 nkf 出力 使 一覧 e euc 出力 s shift jis 出力 w utf 8 出力 bom無 g 自動判別 結果 表示 overwrite 引數 直接上書 如果是solaris環境...
jquery如何檢查字串中是否包含指定字元?
方法 使用indexof 或lastindexof 來檢查,它們都可返回指定字元在字串中的位置,如果字串不包含指定字元,則返回 1 因此只需判斷返回值是否大於等於即可,例 if 字串.indexof 字元 0 相關推薦 jquery 教程 方法一 使用indexof 和lastindexof 方法 ...
檢查字串是否相等
在j a中可以使用 equals 方法判斷兩個字串是否相等。s.equals t 如果字串s與字串t相等,則返回true 否則,返回false。想要檢測兩個字串是否相等,而不區分大小寫,可以使用equalsignorecase方法 hello equalsignorecase hello 一定不要使...