win – 編碼gbk linux – 編碼utf-8 mac – 編碼utf-8
<1> ascii碼:
支援:英文,數字,符號 1位元組
不支援:中文
<2> gbk(國標):
支援:英文,數字,符號 — ascii 1位元組
支援:中文 2位元組
<3> unicode(萬國碼):
支援:英文,數字,符號 —asscii 4位元組
支援:歐洲 4位元組
支援:亞洲 4位元組
<4> utf – 8:
支援:英文,數字,符號 —asscii 1位元組
支援:歐洲 2位元組
支援:亞洲 3位元組
1位元組 == 8位 (10101001)
位元組:儲存和傳輸
領域:web開發,爬蟲,資料分析,資料探勘,人工智慧
零基礎到專案實戰,7天學習上手做專案
<5>位元組名.encode(「utf-8」) #編碼
s = "今天" # b'\xe4\xbb\x8a\xe5\xa4\xa9'
s1 = s.encode("utf-8") # 編碼
print(s1)
<6>位元組名.decode(「utf-8」) #解碼
s = "今天" # b'\xe4\xbb\x8a\xe5\xa4\xa9'
s1 = s.encode("utf-8") # 編碼
s2 = s1.decode("utf-8") # 解碼
print(s2)
用什麼編碼就要用什麼解碼
網路傳輸一定是位元組
python3:預設編碼unicode
python2:預設編碼ascii python不支援中文
1位元組 == 8位 ( 1bytes == 8bit )
python網路爬蟲入門之URL編碼模組
為什麼要給位址 編碼 我們在瀏覽器裡面輸入查詢引數時瀏覽器會自動給我們進行編碼,當我們用爬蟲程式進行獲取內容時瀏覽器識別不了我們所輸入的內容,所以就要編碼給url位址中查詢引數進行編碼 編碼前 https 美女編碼後 https e7 be 8e e5 a5 b3 比如我們在瀏覽器裡輸入 美女 瀏覽...
Python之檔案編碼
1.ascii編碼 2.utf 8編碼格式f open 檔案路徑 rb f read f.read f read decode f read.decode 該檔案的編碼方式 print f read decode 在python 2.x檔案的第一行增加以下 直譯器會以utf 8編碼來處理python...
python之字元編碼
python3 d a.py 1 先啟動python直譯器 2 直譯器會將a.py的內容當成普通記憶體從硬碟讀入記憶體,此時沒有語法意義 3 直譯器會解釋執行剛剛讀入記憶體的記憶體,開始識別python語法 1 相同點 python直譯器是解釋執行檔案內容的,因而python直譯器具備讀py檔案的功...