萬惡之源 再談編碼

2022-08-21 19:36:11 字數 823 閱讀 1050

1.is和==區別

id()內建函式

== 判斷兩邊的值

is 判斷記憶體位址

回顧編碼

1. ascii: 英文, 特殊字元, 數字, 8bit, 1byte

2. gbk: 中文 16bit, 2byte. 相容ascii

3. unicode: 萬國碼, 32bit 4byte. 相容ascii

4. utf-8: 長度可變的unicode. 英文:8bit, 歐洲:16bit, 中文:24bit 3byte

python只能用ascii

python 有unicode,預設的編碼就是unicode

記憶體裡用的是unicode.硬碟和網路傳輸用的是utf-8活著gbk

2.encode()編碼.獲取到的是編碼之後的結果.bytes

3.decode()解碼.把byes程式設計我們熟悉的字串

編碼和解碼的時候都需要制定編碼格式.

s = "

我是文字

"bs = s.encode("

gbk") #

我們這樣可以獲取到gbk的文字

s = bs.decode("

gbk") #

解碼 bss = s.encode("

utf-8

") #

重新編碼

print(bss)

# 把gbk轉換成utf-8

# 首先要把gbk轉換成unicode. 也就是需要解碼

# 然後需要進⾏重新編碼成utf-8

過早優化是萬惡之源

don t cut yourself code optimization as a double edged sword。中文翻譯 過早優化是萬惡之源。優化的好處多多,但是這並不意味著所有的 都需要進行優化,有時過度的優化反而適得其反 費時 費力 不討好。現代電腦科學的鼻祖 donald knuth...

萬惡之源 檔案操作

檔案操作 f open 檔名,mode 模式 encoding 編碼格式 模式 r,w,a,r w a rb,wb,ab,r b,w b,a b 1 開啟檔案,得到檔案控制代碼並賦值給乙個變數 f open a.txt r encoding utf 8 預設開啟模式就為r 2 通過控制代碼對檔案進行...

05 萬惡之源 基本資料型別 dict

1.字典的簡單介紹 2.字典增刪改查和其他操作 3.字典的巢狀 一.字典的介紹 字典 dict 是python中唯一的乙個對映型別.他是以括起來的鍵值對組成.在dict中key是唯一的.在儲存的時候,根據key來計算出乙個記憶體的位址.然後將key value儲存在這個位址中.這種演算法被稱為has...