//build gcc -g gb.c -o gb.exe //
//characters in gb2312 are divided into codepoints, with each codepoint comprising 94 glyphs/characters. //
//the codepoints can be divided and categorised as:
// * 01-09, comprising punctuation and other special characters.
// * 16-55, the first plane for chinese characters, arranged according to pinyin.
// * 56-87, the second plane for chinese characters, arranged according to radical and strokes. //
//the codepoints 10-15 and 88-94 are unassigned. //
//
#include
<
stdio
.h>
static
void
dumprange
(file
* fp
, unsigned
shortn)
fflush(fp
);
return;
}
static
void
dumpgb2312
(void)
else
return
;
}
intmain
(int
argc
, char
* argv)
GB2312的編碼規則
gb2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個 同時,gb2312收錄了包括拉丁字母 希臘字母 日文平假名及片假名字母 俄羅斯語西裡爾字母在內的682個全形字元。gb2312的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆蓋99.75 的使用頻率。gb2...
根據GB2312漢字區位碼獲取漢字拼音的工具類
size x large 申明 本工具類的原型來自網際網路,本人作了演算法上的調整。所以嚴格上不算原創,只能算是編著。主要思路 根據gb2312漢字的區位碼,建立區位碼與拼音的對應關係,因為一定範圍內的漢字區位碼的拼音是一樣的,例如,如果漢字的區位碼在 20317,20319 範圍內,那麼其拼音為 ...
Java之將GB2312編碼轉化為漢字
本文實現將gb2312編碼轉換成漢字,並簡單瞭解一下gb2312編碼。gb2312是資訊交換漢字編碼字符集,適用於漢字處理 漢字通訊等系統之間的資訊交換,通行於中國大陸。使用區位碼錶示方式,對所收漢字進行了 分割槽 處理,每區含有94個漢字 符號。注 將gb2312編碼轉化為漢字方法 string ...
php輸出全部gb2312編碼內的漢字方法
php輸出全部gb2312編碼內的漢字,area表示分割槽,pos表示分割槽內所在位置。for area 0xb0 area 0xf7 ar程式設計客棧ea 程式設計客棧 for pos 0xa1 pos 程式設計客棧0xfe pos fwritiudadolle fp,pack cc area,p...
字符集GB2312的理解
在計算機程式中,通常都有涉及到gbk,gb2312編碼方式的問題。常見的是網頁開啟是亂碼啊,api之間傳輸的是亂碼字元啊等等。我們都知道,在計算機程式中,所有的資訊都是以01來表示的,之所以編碼是人類需要和計算機溝通。例如,人類要將一個漢字如 啊 儲存在計算機中,如果採用gb2312編碼儲存的話,啊...