python字元編碼

2021-08-02 11:17:03 字數 876 閱讀 1972

列印python檔案編碼

import sys

print(sys.getdefaultencoding())

中文的乙個字元unicode占用2個位元組。對在於ascii字元占用1個位元組

utf-8中:中文字元佔3個位元組,英文本元占用1個位元組

編碼和轉碼:unicode不能再解碼了(它是基層的~~)

unicode----encode---->gbk                     gbk----decode---->unicode

unicode----encode---->utf-8                   utf-8----decode---->unicode

#!/usr/bin/env python

# -*- coding:utf-8 -*-

# author:coke

s='你好'

#s是unicode

s_to_gbk=s.encode('gbk') #編碼採用gbk

s_to_utf8=s.encode() #預設的編碼是utf-8

#decode中解碼型別寫原型別,告訴它我是誰

#encode中編碼型別寫新型別,告訴它轉成誰

gbk_to_utf8=s_to_gbk.decode("gbk").encode("utf-8")

utf8_to_gbk=s_to_utf8.decode("utf-8").encode("gbk")

print(s_to_gbk)

print(utf8_to_gbk)

print(s_to_utf8)

print(gbk_to_utf8)

python字元編碼

ascii 碼是乙個位元組,通常只能顯示英文本母和數字。unicode碼為了顯示多種語言產生,但是要占用兩個位元組,顯示文字要占用大量空間 utf 8 為了節約空間而生,英文本元只用乙個位元組儲存,中文字元需要三個位元組 character ascii unicode utf 8 a01000000...

Python字元編碼

在用python程式設計中,字串有兩種表示方法 string 和 u string 為什麼字串要是用這兩種表達方式。不是僅僅用前一種呢?使用type 函式檢視,它們各自是str物件和unicode物件。這兩個物件有什麼差別嗎?還有經經常使用到的encode 和decode 又是幹什麼的呢?都說pyt...

Python字元編碼

計算機只能處理數字,如果要處理文字,必須先把文字轉化成數字。計算機最早是美國人發明的,所以只有127個字元被編碼到計算機裡面,即大小寫英文本母 數字及一些符號,這個編碼表被稱為ascll表。其中 a 的編碼是65,a 的編碼是97。大本事處理中文乙個位元組是不夠的,至少需要兩個位元組,為了不與asc...