前不久有個網友問我說修改l-blog時老是出現亂碼,好像和其他的中文編碼不一樣,我說因為採用了utf-8編碼。現在大多數程式(bbs|blog)都是基於gb2312編碼的,但是為什麼要改用相容性不好(容易亂碼)的utf-8呢?開始我也不了解,直到我看了zola的這片文章才有所了解:
中文有三種字符集,統一文字的編碼將是進一步交流的基礎。
·國內**和blog較多使用簡體中文編碼gb2312
·港澳台地區**和部落格使用正體中文網頁編碼big5
·utf-8
統一編碼帶來的交流便利將在trackback等功能上體現出。
介紹utf8編碼
utf8並不算是一種電腦編碼,而是一種儲存和傳送的格式,如前所述,每個unicode ucs字元都以 2或4個bytes來儲存,看看以下的比較 以 i am chinese 為例 用ansi儲存 12 bytes 用unicode ucs2儲存 24 bytes 2 bytes header 用uc...
UTF8編碼 解碼
參考文件 rfc3629標準.對於任意乙個字,都可以用乙個唯一碼 unicode碼,由標準編制 表示,在應用過程中,需要對碼進行編碼.常用的編碼方式為utf 8.utf 8採用類似於ip位址分配的機制.即對於不同範圍的unicode碼,採用不同的模板進行編碼.流程概述為 2.1 查表獲取unicod...
為什麼不要在MySQL中使用UTF 8編碼方式
mysql 從 4.1 版本開始支援 utf 8,也就是 2003 年,然而目前流行的utf 8 標準 rfc 3629 是在此之後規定的。正因此,才造就了mysql中的utf 8與我們日常開發中的utf 8不一致,從到導致了些問題。mysql的utf 8只支援每個字元最多三個位元組,而真正的 ut...