星期二, 12月 16, 2008

Chinese character code

相對於台灣用大五碼,大陸用國家標準代碼,簡稱國標碼(GuoBiao)來做為漢字編碼集。

GB2312-80 是大陸官方在1981年5月1日實施。幾乎大陸所有中文系統及國際化軟體都支援GB2312。

微軟的 CP936 與 GB2312 幾乎是一樣的編碼。
微軟後來對 CP936 做擴展,後來稱為 GBK。K是由擴展的漢語拼音 Kuo而來。

GB18030-2000 是大陸官方在2000年推出的標準。後來在 2005年推出其修訂版,稱GB18030-2005。

GB18030 完全相容 GB2312;基本相容 GBK。

cclib.16 是一個 GB2312 的點陣字型檔,其字型大小為 16x16 點。

GB2312 0xA1A1-0xA7FE 對應到 cclib.16 是從檔案的 0 開始。
GB2312 0xB0A1-0xF7FE 對應到 cclib.16 是從檔案的 0x5240 開始。

GB2312 的編碼表可以參考下面的網址
http://www.geocities.com/SiliconValley/Bit/3862/simplify/sim1/gbcode.html

例如,"啊" 的 GB碼是 0xB0A1,你可以從 cclib.16 的 0x5240 開始,連續讀 32 bytes。
每兩個位元組表示一列,共16列。將之展開為二進制後,你就可以看到"啊"這個字了。

沒有留言: