本地化過程中涉及到原始檔和目標檔案的傳輸問題,這時候編碼就顯得很重要。中文的網頁和作業系統中通常採用ansi編碼,這也是微軟os的乙個字元標準。對於ansi,不同的國家和地區制定了不同的標準,由此產生了gb2312(簡體中文),big5(正體中文),jis(日文)等各自的編碼標準。但不同的ansi編碼在不同語言之間是不相容的,所以對於不同的作業系統之間檔案的傳輸,或者在同樣的作業系統下,原始檔語言不同於os的語言檔案的傳輸,
需要轉換成ut8格式
。具體區別:
ansi:16384
個字元。這就是
ansi
字元標準。英文乙個位元組,中文兩個位元組
unicode:
使用兩個位元組對世界上幾乎所有的語言進行編碼
(0x0000
-0xffff
),65536
個字元,每種語言的**段不
同,兩個位元組
(英文、中文都是兩個位元組
)所表達的字元是唯一的,所以不同語種可以共存於文字中,解決國際化的問題
utf8
是unicode
一種壓縮形式
,英文a
在unicode
中表示為
0x0041
,老外覺得這種儲存方式太浪費,因為浪費了
50%的空間,於是就把英文壓縮成
1個位元組,
成了utf8
編碼,但是漢字在
utf8中佔3
個位元組,顯然用做中文不如
ansi
合算,這就是中國的網頁用作
ansi
編碼而老外的網頁常用
utf8
的原因。
在英文os中,要在control and panel settings- regional and language options,standards and formats設成english的。
ANSI, UNICODE,UTF8編碼的區別
本地化過程中涉及到原始檔和目標檔案的傳輸問題,這時候編碼就顯得很重要。中文的網頁和作業系統中通常採用ansi編碼,這也是微軟os的乙個字元標準。對於ansi,不同的國家和地區制定了不同的標準,由此產生了gb2312 簡體中文 big5 正體中文 jis 日文 等各自的編碼標準。但不同的ansi編碼在...
ANSI UNICODE UTF 位元組序 BOM
utf的位元組序和bom utf 8以位元組為編碼單元,沒有位元組序的問題。utf 16以兩個位元組為編碼單元,在解釋乙個utf 16文字前,首先要弄清楚每個編碼單元的位元組序。例如收到乙個 奎 的unicode編碼是594e,乙 的unicode編碼是4e59。如果我們收到utf 16位元組流 5...
8月8日小結
又經歷一次比賽,今天比賽前兩道題都比較簡單,第一題沒有難度,第二題理解起來有些麻煩,看了好一會才搞懂題意,不過被題意帶進坑了去了,題意就是取區間內的數從小到大重新排列,看要求的位置數字有沒有變化,看懂後便直接用sort寫了,測試沒問題,提交就超時,重新優化了幾個地方,依舊是超時,才感覺出來這是個坑。...