mysql中涉及的幾個字符集
character-set-server/default-character-set:伺服器字符集,預設情況下所採用的。
character-set-database:資料庫字符集。
character-set-table:資料庫表字符集。
優先順序依次增加。所以一般情況下只需要設定character-set-server,而在建立資料庫和表時不特別指定字符集,這樣統一採用character-set-server字符集。
character-set-client:客戶端的字符集。客戶端預設字符集。當客戶端向伺服器傳送請求時,請求以該字符集進行編碼。
character-set-results:結果字符集。伺服器向客戶端返回結果或者資訊時,結果以該字符集進行編碼。
在客戶端,如果沒有定義character-set-results,則採用character-set-client字符集作為預設的字符集。所以只需要設定character-set-client字符集。
要處理中文,則可以將character-set-server和character-set-client均設定為gb2312,如果要同時處理多國語言,則設定為utf8。
關於mysql的中文問題
解決亂碼的方法是,在執行sql語句之前,將mysql以下三個系統引數設定為與伺服器字符集character-set-server相同的字符集。
character_set_client:客戶端的字符集。
character_set_results:結果字符集。
character_set_connection:連線字符集。
設定這三個系統引數通過向mysql傳送語句:set names gb2312
即在php中執行:mysql_query(「set names gb2312」);
關於gbk、gb2312、utf8
gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中、英文本元均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比utf8差,不過utf8占用的資料庫比gbd大。
gbk、gb2312等與utf8之間都必須通過unicode編碼才能相互轉換:
gbk、gb2312--unicode--utf8
utf8--unicode--gbk、gb2312
對於乙個**、論壇來說,如果英文本元較多,則建議使用utf-8節省空間。不過現在很多論壇的外掛程式一般只支援gbk。
gb2312是gbk的子集,gbk是gb18030的子集
gbk是包括中日韓字元的大字符集合
如果是中文的** 推薦gb2312 gbk有時還是有點問題
為了避免所有亂碼問題,應該採用utf-8,將來要支援國際化也非常方便
utf-8可以看作是大字符集,它包含了大部分文字的編碼。
使用utf-8的乙個好處是其他地區的使用者(如香港台灣)無需安裝簡體中文支援就能正常**你的文字而不會出現亂碼。
gb2312是簡體中文的碼
gbk支援簡體中文及正體中文
big5支援正體中文
utf-8支援幾乎所有字元
mysql 集群字符集 Mysql 字符集
字符集與字元比較 字符集字符集是某種字元的集合,比如最常見的ascii碼,由127個字元組成,只需要乙個位元組就能表示 我們常說的字符集還是gbk iso utf8 mysql 我們使用得最多的字符集就是gbk 和 utf8了 他們都是變長字符集,如果字元在ascii範圍內就使用乙個位元組表示,其他...
mysql字符集 MySQL字符集選擇
一 怎樣選擇合適的字符集 對mysql資料庫來說,字符集很重要,因為資料庫儲存的資料大部分都是各種文字,字符集對資料庫的儲存,處理效能都會有所影響。主要考慮一下幾方面的因素 1.滿足應用支援語言的需求,應用處理各種各樣的文字,發布到使用不同語言的國家或地區,可以選擇unicode字符集,mysql的...
mysql api 字符集 MySQL字符集
mysql字符集包括字符集 character 和 collation 兩個概念。字符集是用來定義mysql儲存字串的規則,校對規則則是定義了比較字串的方式。字串和校對規則是一對多的 關係。使用命令 show collation like gbk 可檢視相關的校對規則 使用 show charact...