一、unicode與多字符集(ansi)是兩種文字編碼方式;
1、ansi時,各國文字的編碼之間有些重疊編碼(編碼衝突);
2、unicode,各國編碼統一編碼,無論在哪國的作業系統中,各國的文字都能無障礙顯示;
3、wchar_t是屬於雙位元組變數;
4、unicode的字串常量需要在前面加乙個大寫的l,const wchar_t *p=l"abnde今天";
5、tchar型別是兩種編碼格式的自適應型別,tchar* t1=_t("djaewlk共和國");
二、unicode與多字符集(ansi)字串的相互轉換:
1、widechartomultibyte();
2、multibytetowidechar();
三、windows作業系統每個api函式都提供了兩套介面;
***a()函式帶入的是傳統的多字符集文字;
***w()函式帶入的是unicode文字;
1、當為多字符集時,所有的api都是自動呼叫a介面;
2、當為unicode時,所有的api都是自動呼叫w介面;
Unicode字符集和多字符集
由於各國語言的加入,ascii已經不能滿足資訊交流的需要,因此,為了能夠表示其它國家的文字,各國在ascii的基礎上制定了自己的字符集,它們正式的名稱應該是mbcs multi byte chactacter system,即多位元組字元系統 型別說明 unicode ansi 通用型別 字元wch...
單位元組字符集,多位元組字符集,Unicode
我們在這裡介紹一下字元型別。這裡有3種編碼模式對應3種字元型別。第一種編碼型別是單子節字符集 single byte character set or sbcs 在這種編碼模式下,所有的字元都只用乙個位元組表示。ascii是sbcs。乙個位元組表示的0用來標誌sbcs字串的結束。第二種編碼模式是多位...
MFC在Unicode字符集下讀寫ANSI編碼檔案
讀取ansi編碼檔案時,先將檔案儲存在char 指向的記憶體內,而後使用轉換將char 轉換為w char t wchar t 可以使用cstring的 format函式。cfile file t test.txt cfile moderead 讀ansi編碼的檔案 int filelen file...