python 字元編碼與檔案處理

2022-03-22 18:18:01 字數 1928 閱讀 5063

字元編碼

計算機工作就要通電,也就是說『電『驅使計算機幹活,而電只有高電壓(二進位制1),低電壓(二進位制0),也就是說計算機只認數字。

程式設計的目的就是讓計算機幹活,程式設計的結果就是一堆字元,也就是我們程式設計最終實現的是:一堆字元驅動計算機幹活呢。

1:python直譯器是執行檔案內容的,因而python直譯器具備讀py檔案的功能,

這一點與文字編輯器一樣。

還可以執行檔案內容。

字元------------à(翻譯過程)----------------à數字

這個過程實際就是乙個字元如何對應乙個特定的數字標準,這個標準稱之為數字編碼。

一:ascll:

乙個bytes=8bit--------------à可以表示為2**8種變化

00000000-------------à0------------------à』a』

00000001-------------à1------------------à』b』

1*(2**8)+1*(2**6)+1*(2**4)+1*(2**)

ascll:最初只有七位,127個數字。

為了將拉丁文也編碼進ascll中,將最高位也佔了。

二:為了滿足中文,中國人定製了gbk。

gbk:2bytes代表乙個字元。

日本----------shift_jis

南韓----------evc-kr

三:unicode,統一用2(2bytes)位代表乙個字元。(萬國編碼)

優點:轉換速度快。

缺點:占用空間大。

2**16=65536,可代表多個字元。

1bytes    =    8bit

1kb      =     1024bytes

1mb     =     1024kb

1gb      =     1024mb

1027tb   =     1024gb

1gb      =     1024*1024*1024*1024*8

四:utf—8(可變長的字元編碼)-----------à精準,對不同的字元用不同的長度表示。

優點:節省空間。

缺點:轉換速度慢。

對英文本元只用1gytes,對中文只能用3byte          

1記憶體中使用的是unicode,用空間換時間(程式都需要載入到記憶體才能執行,因而記憶體要盡可能的快)

2:硬碟中或者網路傳輸用utf_8,保證資料傳輸的穩定性。

unicode---------àencode-----------àutf-8

utf-8---------àdcode------------àunicode

結論:用什麼編碼存,就用什麼編碼取。

python3直譯器中,預設的字元編碼是utf-8

python2直譯器中,morn的是ascii

Python 字元編碼與檔案處理

目前計算機記憶體的字元編碼都是unicode,目前國內的windows作業系統採用的是gbk。python2預設的字元編碼方式是ascii python3預設的字元編碼方式是unicode py檔案頭部的 coding utf 8是幫助python識別.py檔案的編碼方式,故在寫.py檔案時要注意檔...

python檔案操作 字元編碼與檔案處理

本文目錄 一 字元編碼 二 檔案處理 應用程式 作業系統 計算機硬體 1.先啟動python直譯器 2.再將python檔案當作普通的文字檔案讀入記憶體 3.解釋執行讀入記憶體的 開始識別語法 字元編碼表 人類的字元 數字 1bytes 8bit 1b 8b 1位元組等於8個二進位制位 ascii碼...

python字元編碼和檔案處理

一.了解字元編碼的知識儲備 1.文字編輯器訪問檔案的原理 nodepad python,word 2.python直譯器執行py檔案的原理,python,test.py 3.過程 文字編輯器 乙個檔案的三個過程 cpython直譯器執行乙個py檔案的三個過程 4.字元編碼 字元編碼指的是字元轉換成或...