程式設計中經常用到字元編碼,常用字元編碼有ascii(american standard code for information interchange)編碼、
unicode編碼;unicode編碼又有utf-8形式和utf-16形式;
ascii表如下:
擴充套件ascii表如下:
unicode是一種編碼方案,說白了就是張能夠容納全世界所有文字的乙個編碼表,只要是世界上存在的文字元號,都給你乙個編碼值,其編碼範圍:0-0x10ffff;unicode只是乙個符號集,它規定了符號的二進位制**,它不管二進位制**怎麼存放,utf-16/utf-8;utf-16根據範圍,有可能乙個位元組佔2個byte,也有可能佔4個位元組。utf-8根據範圍,有可能佔1-4個位元組,範圍與對應值如下:
unicode編碼(十六進製制) utf-8位元組流(二進位制)
000000-00007f 0******x
000080-0007ff 110***xx 10******
000800-00ffff 1110***x 10****** 10******
010000-10ffff 11110*** 10****** 10****** 10******
下面我們我們用記事本將新建txt檔案並寫入「a中」兩個字元,然後儲存 為ascii和utf-8、utf-16,並用winhex開啟檢視文字十六進製制。得到如下結果:
49 字元編碼
目錄六.總結 開啟編輯器就啟動了乙個程序,是在記憶體中的,所以,用編輯器編寫的內容,也都是存放在記憶體中的,斷電後資料丟失。要想永久儲存,需要點選儲存按鈕 編輯器吧記憶體的資料刷到硬碟上。在我們編寫的乙個py檔案,沒有執行前,和編寫其它檔案沒有任何區別,都只是在編寫一堆字元而已。第三階段 pytho...
07 字元編碼
1.字元編碼 字元編碼針對的是文字無需考慮 視屏 音訊 等 2.編寫文字的過程 輸入的字元 字元編碼表 二進位制數字 2.1字元編碼表 就是字元與數字的對應關係 a 0 b 1 a 00 b 01 c 11 d 10 2.2ascii碼表 用八位二進位制表示乙個英文本元 所有的英文本元 符號最多也就...
3 字元編碼
字元編碼 編者的話 從磁碟中讀取資料時,直接將存在檔案中的二進位制轉換成unicode的二進位制存到記憶體中,需指定乙個編碼如utf 8,前提是檔案在儲存時是以utf 8儲存的.系統中維護了一張關於utf 8到unicode的表,存檔案時,直接通過這張表將記憶體中unicode的二進位制翻譯成utf...