雖說有多種編碼方式,實際上除ascii碼外,其它區位碼、國標碼基本上都是一回事,只是其編碼的方式不同、對漢字的訪問方式不同。機內碼是機器語言編碼,它包括有語言的解釋、各類字元的機器編碼等。ascii碼是常用的字元、符號,為1到255,十六進製制01到ff。區位碼是包括漢字在內的特殊字符集,共分87區,94位,其基數都是從0開始。國標碼實際上是區位碼的字符集,只是其編碼的基數與區位碼有所區別,一般用十六進製制表示,區數從21到79,位數從21到7e。機內碼的字符集編碼是區碼從a1到f7,位碼是從a1到fe。
區位碼
01 01
03 04
05 06
07 08
國標碼
21 22
23 24
25 26
27 28
機內碼
a1 a2
a3 a4
a5 a6
a7 a8
16 30
啊 阿
埃 挨
哎 唉
哀 皚
b0 1.ascii碼:
ascii碼0至32一般為功能控制,48至57為0到9數字,58至90為大寫字母,97至122為小寫字母,其它為常用符號。
2.區位碼:
區位碼的1區是常用圖案符號,2區是序數標數,3區是與ascii相近的常用符號,4、5區日文片假名,6區是拉丁文,7區是俄文,8區是漢語拼音,9區是製表符,16區以後是漢字區。10區至15區為空區。
3.國標碼:
國標碼的推算公式:國標碼=區位碼+20
4.機內碼:
機內碼的推算公式:
機內碼=區位碼+a0
編碼技術:
編碼方式及轉換
ascii碼 用八位二進位制表示乙個英文 乙個位元組 unicode 中英文均用32位二進位制表示 四個位元組 utf 8 英 8位 乙個位元組 中 24位 三個位元組 gbk 英 8位 乙個位元組 中 16位 兩個位元組 1 各個編碼之間的二進位制不能相互識別 2 檔案的儲存,傳輸不能是unico...
mysql 轉換編碼方式
vim etc my.cnf 在 mysqld 標籤下加上三行 default character set utf8 character set server utf8 在 mysql 標籤下加上一行 default character set utf8 在 mysql.server 標籤下加上一行...
計算機常用編碼方式
常用編碼方式 標準ascii碼 擴充套件ascii碼 utf 8 utf 16。用乙個位元組大小表示常用的字元,最開始ascii碼只表示128個字元,只需要7位表示,最高位統一用0表示。ascii碼編碼方式通過大端方式對齊。不同國家,使用的字元不一致,僅僅128個字元不夠使用,所以針對本國字元特點,...