字元編碼
計算機工作就要通電,也就是說『電『驅使計算機幹活,而電只有高電壓(二進位制1),低電壓(二進位制0),也就是說計算機只認數字。
程式設計的目的就是讓計算機幹活,程式設計的結果就是一堆字元,也就是我們程式設計最終實現的是:一堆字元驅動計算機幹活呢。
1:python直譯器是執行檔案內容的,因而python直譯器具備讀py檔案的功能,
這一點與文字編輯器一樣。
還可以執行檔案內容。
字元------------à(翻譯過程)----------------à數字
這個過程實際就是乙個字元如何對應乙個特定的數字標準,這個標準稱之為數字編碼。
一:ascll:
乙個bytes=8bit--------------à可以表示為2**8種變化
00000000-------------à0------------------à』a』
00000001-------------à1------------------à』b』
1*(2**8)+1*(2**6)+1*(2**4)+1*(2**)
ascll:最初只有七位,127個數字。
為了將拉丁文也編碼進ascll中,將最高位也佔了。
二:為了滿足中文,中國人定製了gbk。
gbk:2bytes代表乙個字元。
日本----------shift_jis
南韓----------evc-kr
三:unicode,統一用2(2bytes)位代表乙個字元。(萬國編碼)
優點:轉換速度快。
缺點:占用空間大。
2**16=65536,可代表多個字元。
1bytes = 8bit
1kb = 1024bytes
1mb = 1024kb
1gb = 1024mb
1027tb = 1024gb
1gb = 1024*1024*1024*1024*8
四:utf—8(可變長的字元編碼)-----------à精準,對不同的字元用不同的長度表示。
優點:節省空間。
缺點:轉換速度慢。
對英文本元只用1gytes,對中文只能用3byte
1:記憶體中使用的是unicode,用空間換時間(程式都需要載入到記憶體才能執行,因而記憶體要盡可能的快)
2:硬碟中或者網路傳輸用utf_8,保證資料傳輸的穩定性。
unicode---------àencode-----------àutf-8
utf-8---------àdcode------------àunicode
結論:用什麼編碼存,就用什麼編碼取。
python3直譯器中,預設的字元編碼是utf-8
python2直譯器中,morn的是ascii。
Python 字元編碼與檔案處理
目前計算機記憶體的字元編碼都是unicode,目前國內的windows作業系統採用的是gbk。python2預設的字元編碼方式是ascii python3預設的字元編碼方式是unicode py檔案頭部的 coding utf 8是幫助python識別.py檔案的編碼方式,故在寫.py檔案時要注意檔...
python檔案操作 字元編碼與檔案處理
本文目錄 一 字元編碼 二 檔案處理 應用程式 作業系統 計算機硬體 1.先啟動python直譯器 2.再將python檔案當作普通的文字檔案讀入記憶體 3.解釋執行讀入記憶體的 開始識別語法 字元編碼表 人類的字元 數字 1bytes 8bit 1b 8b 1位元組等於8個二進位制位 ascii碼...
python字元編碼和檔案處理
一.了解字元編碼的知識儲備 1.文字編輯器訪問檔案的原理 nodepad python,word 2.python直譯器執行py檔案的原理,python,test.py 3.過程 文字編輯器 乙個檔案的三個過程 cpython直譯器執行乙個py檔案的三個過程 4.字元編碼 字元編碼指的是字元轉換成或...