西文字元編碼最常用的是 ascii(美國資訊交換標準**)字元編碼,該編碼是國際上使用最廣泛的一種西文字元編碼。
那麼,漢字也有自己的字元編碼,即漢字字元編碼。漢字字元編碼是 gb2312-80(《資訊交換用漢字編碼字符集——基本集》),即(漢字)國標碼。
國標碼使用兩個位元組進行編碼,每個位元組的低 7 位是漢字的實際儲存位,最大可容納 128×128 = 16384 個漢字字集字元。
區位碼是四位的十進位制數,前兩位是區碼,後兩位是位碼。而國標碼是四位的十六進製制數。可以說,國標碼就是區位碼,只是使用的進製數不同。
區位碼轉換為國標碼的公式:
\[漢字國標碼=漢字區位碼+2020h
\]在計算漢字國標碼時,要注意進製的轉換。也就是說,漢字區位碼必須轉換為十六進製制再計算。
漢字在計算機內部使用的編碼就是內碼,也稱機內碼。注意,機內碼是漢字被儲存在計算機內部的編碼,而國標碼是對漢字進行編碼的字符集編碼。
機內碼與國標碼之間有著明顯的區別。國標碼可以被看作是字典目錄,而機內碼可以被看作是字典實實在在記錄的每一條資料。
國標碼轉換為機內碼的公式:
\[漢字機內碼=漢字國標碼+8080h
\]乙個漢字「大」的區位碼是 2083,求國標碼和機內碼?
20 是區碼,83 是位碼,兩者都是十進位制數,因此需要轉換為十六進製制數,分別是 14h 和 53h。
那麼,國標碼就是1453h + 2020h = 3473h
。機內碼就是3473h + 8080h = b4f3h
。
UML簡單概述
一 物件導向技術 1.物件導向技術出現於 20世紀 70年代末,是軟體工程領域中的重要技術 2.是一種程式設計方法 3.是一種對現實世界中問題的抽象方式 4.對物件導向建模技術的研究的主要成果就是統一建模語言 軟體衡量指標 外部 使用者方面 1.正確性 軟體執行結果是否正確 2.健壯性 這個軟體是不...
Javascript DOM 簡單概述
元素節點 nodetype 1 屬性節點 nodetype 2 文字節點 nodetype 3 遍歷dom選取 document.getelementbyid document.getelementsbyclass document.getelementsbytagname 根據已知元素選取 ele...
HTTP簡單概述
型別 提供的mime型別由數百個。很多很多。uriurl 同一資源定位符 描述了一台特定伺服器上某資源的特定位置。他們說明如何從乙個精確 固定的位置獲取資源。在這裡插入描述 如上,顯示了 url 如何精確地說明某資源的位置以及如何去訪問它。1.url 的第一部分被稱為方案 scheme 說明了訪問資...