關於計算機字符集編碼

2021-08-28 03:40:31 字數 1639 閱讀 5276

**頁是字符集編碼的別名,也有人稱」程式碼頁」。早期,**頁是ibm稱呼電腦bios本身支援的字符集編碼的名稱。當時通用的作業系統都是命令列介面系統,這些作業系統直接使用bios**的vga功能來顯示字元,作業系統的編碼支援也就依靠bios的編碼。現在這bios**頁被稱為oem**頁。圖形作業系統解決了此問題,圖形作業系統使用自己字元呈現引擎可以支援很多不同的字符集編碼。

早期ibm和微軟內部使用特別數字來標記這些編碼,其實大多的這些編碼已經有自己的名稱了。雖然圖形作業系統可以支援很多編碼,很多微軟程式還使用這些數字來點名某編碼。

下表列出了所有支援的**頁及其國家(地區)或者語言:

**頁 國家(地區)或語言

437 美國

708 阿拉伯文(asmo 708)

720 阿拉伯文(dos)

850 多語言(拉丁文 i)

852 中歐(dos) - 斯拉夫語(拉丁文 ii)

855 西里爾文(俄語)

857 土耳其語

860 葡萄牙語

861 冰島語

862 希伯來文(dos)

863 加拿大 - 法語

865 日耳曼語

866 俄語 - 西里爾文(dos)

869 現代希臘語

874 泰文(windows)

932 日文(shift-jis)

936 中國 - 簡體中文(gb2312)

949 韓文

950 正體中文(big5)

1200 unicode

1201 unicode (big-endian)

1250 中歐(windows)

1251 西里爾文(windows)

1252 西歐(windows)

1253 希臘文(windows)

1254 土耳其文(windows)

1255 希伯來文(windows)

1256 阿拉伯文(windows)

1257 波羅的海文(windows)

1258 越南文(windows)

20866 西里爾文(koi8-r)

21866 西里爾文(koi8-u)

28592 中歐(iso)

28593 拉丁文 3 (iso)

28594 波羅的海文(iso)

28595 西里爾文(iso)

28596 阿拉伯文(iso)

28597 希臘文(iso)

28598 希伯來文(iso-visual)

38598 希伯來文(iso-logical)

50000 使用者定義的

50001 自動選擇

50220 日文(jis)

50221 日文(jis-允許乙個位元組的片假名)

50222 日文(jis-允許乙個位元組的片假名 - so/si)

50225 韓文(iso)

50932 日文(自動選擇)

50949 韓文(自動選擇)

51932 日文(euc)

51949 韓文(euc)

52936 簡體中文(hz)

65000 unicode (utf-7)

65001 unicode (utf-8)

計算機常識之編碼解碼字符集

編碼就是將字元對映成二進位制,解碼是將二進位制對映到字元 字符集包括以下幾種 ascii字符集 共收錄128個字元,所以使用1個位元組來進行編碼 iso 8859 1 字符集,共收錄256個字元,是在ascii字符集的基礎上又擴充了128個西歐常用字元 gb2312字符集收錄了漢字以及拉丁字母 希臘...

計算機中的字元編碼與字符集的關係

什麼是字符集 在介紹字符集之前,我們先了解下為什麼要有字符集。我們在計算機螢幕上看到的是實體化的文字,而在計算機儲存介質中存放的實際是二進位制的位元流。那麼在這兩者之間的轉換規則就需要乙個統一的標準,否則把我們的u盤查到老闆的電腦上文件就亂碼了,小夥伴qq上傳過來的檔案在我們本地開啟又亂碼了。ps ...

計算機字元編碼

因為計算機只能處理數字,如果要處理文字,就必須先把文字轉換為數字才能處理。最早的計算機在設計時採用8個位元 bit 作為乙個位元組 byte 所以,乙個位元組能表示的最大的整數就是255 二進位制11111111 十進位制255 如果要表示更大的整數,就必須用更多的位元組。比如兩個位元組可以表示的最...