07 字元編碼

2022-08-11 04:12:13 字數 1109 閱讀 6678

1.字元編碼

字元編碼針對的是文字無需考慮『視屏、音訊』等

2.編寫文字的過程

輸入的字元 >>>(字元編碼表)>>> 二進位制數字

2.1字元編碼表:

就是字元與數字的對應關係

a 0

b 1

a 00

b 01

c 11

d 10

2.2ascii碼表

用八位二進位制表示乙個英文本元 所有的英文本元+符號最多也就在125位左右

0000 0000

1111 1111

2.3gbk

用2bytes表示乙個中文字元 還是用1bytes表示乙個英文本元

0000 0000 0000 0000

1111 1111 1111 1111 最多能表示65535個字元

2.4萬國碼unicode

統一用2bytes表示所有的字元

a 0000 0000 0010 1010

產生的問題:

1.浪費儲存空間

2.io次數增減,程式執行效率降低(致命)

額外:記憶體中的編碼和硬碟的編碼是不一樣的

1.儲存資料的過程:

記憶體中的unicode(萬國碼)》編碼(endode)》硬碟中的utf——8格式(該格式是二進位制數)

2.讀出資料的過程:

硬碟中的utf-8二進位制資料》解碼(decode)》記憶體中的unicode(萬國碼)

3.亂碼:

當存在硬碟的編碼,與執行環境的編碼不一致則出現亂碼。

保證不亂碼的核心:

以什麼編碼,用對應的編碼解碼即可

4.python2和python3中編碼的區別:

4.1python2

將py檔案按照文字檔案讀入直譯器中預設使用ascii碼(因為在開發python2直譯器的unicode還沒有盛行)

4.1.2檔案頭

# coding:utf-8

4.2python3

將py檔案按照文字檔案讀入直譯器中預設使用utf-8

4.3補充:

1.pycharm終端用的是utf-8格式

2.windows終端採用的是gbk

QT學習 07 字元編碼的問題

title framework cpp qt 07 字元編碼的問題 entryname framework cpp qt 07 char coding date 2020 04 13 17 47 21 categories tags encode qt config 章節描述 實際的國際化專案開發中...

01字元編碼

程式設計中經常用到字元編碼,常用字元編碼有ascii american standard code for information interchange 編碼 unicode編碼 unicode編碼又有utf 8形式和utf 16形式 ascii表如下 擴充套件ascii表如下 unicode是一...

49 字元編碼

目錄六.總結 開啟編輯器就啟動了乙個程序,是在記憶體中的,所以,用編輯器編寫的內容,也都是存放在記憶體中的,斷電後資料丟失。要想永久儲存,需要點選儲存按鈕 編輯器吧記憶體的資料刷到硬碟上。在我們編寫的乙個py檔案,沒有執行前,和編寫其它檔案沒有任何區別,都只是在編寫一堆字元而已。第三階段 pytho...