如何查字元的編碼

2021-08-10 21:16:56 字數 1371 閱讀 4178

這裡針對ascii、unicode、utf8三種編碼方式簡介一下。

ascii編碼,我們選擇常用的gb2312字符集查詢,相同的文字,不同的字符集對應的字元編碼也不一樣,我們以「道」字為例,在gb2312碼表查詢到如下

21 0 1 2 3 4 5 6 7 8 9

0   怠 耽 擔 丹 單 鄲 撣 膽 旦

1 氮 但 憚 淡 誕 彈 蛋 當 擋 黨

2 蕩 檔 刀 搗 蹈 倒 島 禱 導 到

3 稻 悼 道 盜 德 得 的 蹬 燈 登

4 等 瞪 凳 鄧 堤 低 滴 迪 敵 笛

5 狄 滌 翟 嫡 抵 底 地 蒂 第 帝

6 弟 遞 締 顛 掂 滇 碘 點 典 靛

7 墊 電 佃 甸 店 惦 奠 澱 殿 碉

8 叼 雕 凋 刁 掉 吊 釣 調 跌 爹

9 碟 蝶 迭 諜 疊

「道」在21區,32位,所以它的區位碼為2132,轉換成16進製為1520。1520 + a0a0 = b5c0,最終b5c0就是「道」在ascii編碼gb2312字符集下的編碼,在vs中賦值「道」給字串,在記憶體中檢視,它的值就是b5c0。 

unicode編碼,「道」字查詢碼表為9040 + 14 - 1 = 9053,如下表所示,「道」的unicode字元在記憶體中就是9053。

0001

0203

0405

0607

0809

0a0b

0c0d

0e0f

1011

1213

1415

1617

1819

1a1b

1c1d

1e1f

9000退送

適逃逄逅

逆逇逈選

遜逋逌逍

逎透逐逑

遞逓途逕

逖逗逘這

通逛逜逝

逞速cjk9020造逡

逢連逤逥

邐逧逨逩

逪逫逬逭

逮逯逰周

進逳逴逵

逶逷逸逹

逺邏逼逽

逾逿9040遀遁

遂遃遄遅

遆遇遈遉

遊運遌遍

過遏遐遑

遒道達違

遖遺遘遙

遚遛遜遝

遞遟utf8編碼,與unicode編碼可以互相推算出來

道的unicode編碼為9053,換算成二進位制

1001 0000 0101 0011  

加上1110 0000 10 000000 10 000000

得到1110 1001 1000 0001 1001 0011 ,轉換成16進製為e9 81 93,所以「道」的utf8編碼就是e98193。同理可以從utf8反過來推算unicode編碼。

如何判別檔案的字元編碼以及變換字元編碼?

如果是linux環境 可以使用nkf 當然要先判斷有沒有裝這個命令 where is nkf nkf使用方法 nkf 出力 使 一覧 e euc 出力 s shift jis 出力 w utf 8 出力 bom無 g 自動判別 結果 表示 overwrite 引數 直接上書 如果是solaris環境...

jquery如何檢查字串中是否包含指定字元?

方法 使用indexof 或lastindexof 來檢查,它們都可返回指定字元在字串中的位置,如果字串不包含指定字元,則返回 1 因此只需判斷返回值是否大於等於即可,例 if 字串.indexof 字元 0 相關推薦 jquery 教程 方法一 使用indexof 和lastindexof 方法 ...

檢查字串是否相等

在j a中可以使用 equals 方法判斷兩個字串是否相等。s.equals t 如果字串s與字串t相等,則返回true 否則,返回false。想要檢測兩個字串是否相等,而不區分大小寫,可以使用equalsignorecase方法 hello equalsignorecase hello 一定不要使...