day3 計算機儲存容量及字元編碼

2021-09-19 09:30:39 字數 2053 閱讀 7466

計算機容量:

1位 = 1bit

8bit = 1byte = 1位元組

1024bytes = 1kbytes =1kb 1024個字元,小文件 ,幾百k可以表示一張

1024kb = 1million bytes = 1mb = 1兆 , 幾萬字的文件, 大

1024mb = 1gigabytes,乙個清晰的電影,不是高畫質,高畫質能達到數10個g

1024gb = 1tb

1024tb = 1pb

ascii表的作用:將二進位制翻譯**能看懂的字元

ascii每乙個字元統一都需要8個bit來儲存

支援中文的第一張編碼表是gb2312,存乙個中文字元占用兩個位元組。

台灣的編碼表:big5,統一繁體字編碼。

支援中文編碼的編碼表發展史:gb2312–>gbk1.0–>gb18030–>unicode–>utf-8

(每個編碼表編碼都不同)

unicode(統一碼、萬國碼、單一碼),支援所有國家和地區的編碼是電腦科學領域裡的一項業界標準,包括字符集、編碼方案等

平面擁有2^16=65536個碼位

規定存乙個字元,統一占用2個位元組

utf-8是unicode 的擴充套件集,對其進行了壓縮和優化,是可變長的字元編碼集,也是現在應用最廣泛的語言。

英語字母,utf-8編碼和ascii碼是相同的。

ascii碼中的內容用1個位元組儲存,歐洲的字元用2個位元組儲存,東亞的字元用3個位元組儲存

支援英文編碼的編碼表發展史:ascii–>unicode–>utf-8

(每個編碼表編碼都不同)

字元–本質上是一種符號,人類所有的文字,數字,標點……都是符號。

字串–多個字元組成的符號串。

位元組—計算機中儲存資料的單元,乙個8位的二進位制數,是乙個很具體的儲存空間。

windows-cmd的編碼是:gbk

notepad++的編碼是:utf-8

python2.x的預設編碼是:ascii

python3.x的預設編碼是:unicode

unicode是一種字符集, 而gbk和utf-8都是編碼,因此unicode和後兩者不是一類事物, 是無法進行對比的.

unicode與utf-8的聯絡與區別:unicode是記憶體編碼表示方案(是規範),而utf-8是如何儲存和傳輸unicode的方案(是實現)。

在python3.x中字元在計算機的記憶體中統一是以unicode編碼的。只有在字元要被寫進檔案、存進硬碟或者從伺服器傳送至客戶端(例如網頁前端的**)時會變成utf-8.

utf-8帶來了相容性的問題,原有的gbk,gb2312,gb18030編碼檔案都不能正常的處理。

utf8與gbk、gb2312等之間都必須通過unicode編碼才能相互轉換。

unicode是中間編碼,如ascii轉換成utf-8,需 ascii–>unicode–>utf-8

decode 解碼,是其他編碼轉換成unicode

encode 編碼,是unicode轉換成其他編碼

編碼盡量用utf-8格式,已經逐漸成為一種標準。

gb2312是簡體中文的碼

big5支援正體中文

gbk支援簡體中文及正體中文

utf-8支援幾乎所有字元

現在用的主要就是gbk和utf-8可以通過uniccode轉化

在這種方法中,之所以能使高階編碼在使用低階編碼的輸出裝置上顯示出來,是因為unicde是向下相容gb2312和gbk的.

注意:此時不能將高階編碼變成低階的,即不能將noteapt++中的命令轉換為gbk或者gb2312的編碼,然後去執行,這樣反而會直接變成亂碼。

因為python3.x的預設編碼是:unicode,所以想輸出文字,可直接執行命令:print(「我愛北京天安門」),不用提前宣告。

注意:python2.x與python3.x二者print命令的區別,python2.x沒有括號

#檢視python3.x的預設字元編碼

import sys

sys.getdefaultencoding()

#檢視某資料資訊/變數的型別

print(type(變數名)) 或者 type(變數名)

計算機組成原理 day3

今天是2021 3 5。機器數的選擇 補碼溢位 受字長限制,運算的結果會超出資料型別表示的最大範圍 只會發生在同號數的加運算中 溢位檢測 檢測運算元和運算結果的符號位是否一致 運算時最高位和符號位產生的進製位是否同步。最高位指符號位右邊的第一位 採用雙符號位時,運算結果的兩個符號位相同則不溢位,不相...

計算機網路學習筆記day3

計算機網路的體系結構 法律上的 de jure 國際標準 osi 並沒有得到市場的認可。是非國際標準 tcp ip 現在獲得了最廣泛的應用。tcp ip 常被稱為事實上的 de facto 國際標準。計算機網路中的資料交換必須遵守事先約定好的規則。這些規則明確規定了所交換的資料的格式以及有關的同步問...

計算機作業系統Day3 處理機排程及排程演算法

程序排程的時機 切換與過程 方式 排程演算法的評價指標 排程演算法 層次要做什麼 排程發生在 發生頻率 對程序狀態的影響 高階排程 作業排程 按照某種規則,從後背佇列中選擇合適的作業將其調入記憶體,並為其建立程序 外存 記憶體 面向作業 最低無 建立態 就緒態 中級排程 記憶體排程 按照某種規則,從...