電腦上儲存的都是0101這種二進位制;
ascii碼建立初期,僅僅是供美國是用,大小寫加上特殊字元100多個足夠,所以最開始的ascii碼只設計7位,但是設計者預留了一位(以便後續擴充,也就是8位),所以最原始的ascii 最左邊的一位是0,(預留位,擴充使用,7位夠,為了擴充套件預留一位)
8位表示乙個位元組(比如這8bit可以表示乙個a 乙個b 或者其他的特殊字元)
1位元組=8bits
1kb=1024位元組(千位元組)=1024*8 bits
1m=1024kb
1g=1024m
1t=1024g
所以最初設計的ascii只有8位,能夠表示256種不同的字元(乙個英文本元用乙個位元組表示(乙個位元組8位可以表示256種,所以對於英文本元加上特殊字元表示綽綽有餘)),而漢字9萬多種,8位根本表示不了,所以需要拓展:
2**16=65536 種,(也就是16位 16bits 也就是2個位元組才可以標表示65536種)也表示不了全部漢字;
為了解決全球字元表示的問題,建立了unicode(萬國碼)unicode 只有兩種 16位和32位,沒有八位的!:
unicode規定,不管是英文還是中文最開始都用2個位元組也就是16位表示;
兩個位元組(16位 可以表示65536種)可是不夠,所以unicode後來使用四個位元組(32位 ,太夠了,2**32>>9w多種漢字)表示乙個漢字;
但是可以發現使用四個位元組表示乙個漢字簡直太浪費了,針對這種情況,就有了公升級版:utf-8:
也就是乙個中文不再使用4個位元組表示,現在utf-8使用3個位元組(24位)表示乙個漢字;
也就是utf-8其實是unicode的公升級版
其實還可能聽過gbk編碼方式:
是中國開發的,只包括漢字,不包括其他國的語言,僅國內使用;
gbk規定乙個中文使用2個位元組表示(16位,2**16種,其實還是不夠的~)受限『;
摘錄:
Python學習筆記 day02
一 組織列表 1.s.sort 方法可以將列表中的元素按照從小到大的順序排序,而且是永久的改變了 s的元素順序。如果想要倒序排序,則使用 s.sort reverse true 即可。2.sorted s 方法可以將列表 s按照從小到大的順序顯示出來,但只是臨時性地讓 s可以按照從小到大的順序顯示,...
Qt學習筆記day02
帶引數的訊號由於訊號可以過載,則在處理訊號的時候,要注意處理方式 qt5的方法 採用函式指標的方法指向過載的函式 void subwidget funsignal subwidget mysignal connect w,funsignal,this,mainwidget dealsub void ...
Vue學習筆記day02總結
目錄 1.品牌新增 刪除 查詢案例 2.過濾器 2.1全域性過濾器 2.2私有過濾器 3.字串的padstart方法的使用 指定顯示長度 4.自定義全域性按鍵修飾符 5.自定義指令 5.1自定義全域性指令 5.1.1 自定義全域性指令讓文字框獲取焦點 5.1.2 自定義全域性指令設定字型顏色 使用鉤...