字元編碼詳解
2.1.2.1. ascii字符集中的功能/控制字元2.1.2.1.1. 什麼是function code功能碼或 function character功能字元
ascii字符集,大家都知道吧,最基本的包含了128個字元。其中前32個,0-31,即0x00-0x1f,都是不可見字元。這些字元,就叫做控制字元。
這些字元沒法列印出來,但是每個字元,都對應著乙個特殊的控制功能的字元,簡稱功能字元或功能碼function code。
簡言之:ascii中前32個字元,統稱為function code功能字元。
此外,由於ascii中的127對應的是delete,也是不可見的,所以,此處根據筆者的理解,也可以歸為function code。
此類字元,對應不同的「功能」,起到一定的「控制作用」,所以,稱為控制字元。
關於每個控制字元的控制功能縮寫,參見表 2.1 「ascii中的控制字元」
表 2.1. ascii中的控制字元
十進位制十六進製制
控制字元
轉義字元
說明ctrl + 下列字母
nul\0
null character(空字元)
@sohstart of header(標題開始)a2
02stx
start of text(正文開始)b3
03etx
end of text(正文結束)c4
04eot
end of transmission(傳輸結束)d5
05enq
enquiry(請求)e6
06ack
acknowledgment(收到通知/響應)f7
07bel
\abell(響鈴)g8
08bs
\bbackspace(退格)h9
09ht
\thorizontal tab(水平製表符)i10
0alf
\nline feed(換行鍵)j11
0bvt
\vvertical tab(垂直製表符)k12
0cff
\fform feed(換頁鍵)l13
0dcr
\rcarriage return(回車鍵)m14
0eso
shift out(不用切換)n15
0fsi
shift in(啟用切換)o16
10dle
data link escape(資料鏈路轉義)p17
11dc1
device control 1(裝置控制1) /xon(transmit on)q18
12dc2
device control 2(裝置控制2)r19
13dc3
device control 3(裝置控制3) /xoff(transmit off)s20
14dc4
device control 4(裝置控制4)t21
15nak
negative acknowledgement(拒絕接收/無響應)u22
16syn
synchronous idle(同步空閒)v23
17etb
end of trans the block(傳輸塊結束)w24
18can
cancel(取消)x25
19em
end of medium(已到介質末端/介質儲存已滿)y26
1asub
substitute(替補/替換)z27
1besc
\eescape(溢位/逃離/取消)[28
1cfs
file separator(檔案分割符)\29
1dgs
group separator(分組符)]30
1ers
record separator(記錄分隔符)
^311f
usunit separator(單元分隔符)
_3220
spwhite space
[space]
1277f
deldelete(刪除)
?即在c語言中或其他地方如何表示。
可以通過 「ctrl+對應字母/按鍵」實現上述控制字元的輸入
下面列舉一些你可能遇到的情況:
注意此處想要在鍵盤上輸入這三個字元的話,是需要通過shift加上對應字元才能輸入的:
32=0x20,對應的是空格(blank space)鍵。不需要加ctrl鍵,即可直接通過鍵盤上的空格鍵輸入。
127=0x7f=刪除(delete)鍵;,除了可以用鍵盤上的刪除鍵輸入,也可以用'ctrl+?'輸入。
字元編碼詳解
你是否認為 ascii碼 乙個字元就是8位元 你是否認為乙個位元組就是乙個字元,乙個字元就是8位元?你是否還認為你是否還認為utf 8就是用8位元表示乙個字元?如果真的是這樣認為認真讀完這篇文章吧!首先大家需要明確的是在計算機裡所有的資料都是位元組的形式儲存,處理的。我們需要這些位元組來表示計算機裡...
字元編碼詳解
1.acsii表,00000000,8位儲存,一共有256個種表示方法,使用英語的國家使用一張acsii表即可 a,美國人使用只需要128種表示方法即可表示所有字元 b,拉丁國家使用了256種表示方法 2.gb2312,中國人使用,需要兩個位元組,剛開始只能表示幾千個漢字 gbk,能表示所有漢字,2...
python 字元編碼轉換詳解
unicode所有的中文或者英文都是占用兩個位元組 16位 ascii 只能存英文 8位 utf 8 可變長的字元編碼,所有英文按ascll佔乙個位元組,常用中文字元用utf 8編碼占用3個位元組 coding gbk import sys with語句 為了避免開啟檔案後忘記關閉,可以通過管理上下...