所用軟體:editplus
其中有一行關鍵字為:編碼gbk的不可對映字元
在網上搜尋其解決辦法,大部分是儲存成ansi編碼。
於是我儲存為ansi編碼:
於是就可以正常顯示了。
那麼什麼是ansi編碼呢?不同的國家和地區制定了不同的標準,由此產生了 gb2312、gbk、big5、shift_jis 等各自的編碼標準。這些使用 1 至 4 個位元組來代表乙個字元的各種漢字延伸編碼方式,稱為 ansi 編碼。在簡體中文windows作業系統中,ansi 編碼代表 gbk 編碼;在日文windows作業系統中,ansi 編碼代表 shift_jis 編碼。 不同 ansi 編碼之間互不相容,當資訊在國際間交流時,無法將屬於兩種語言的文字,儲存在同一段 ansi 編碼的文字中。 當然對於ansi編碼而言,0x00~0x7f之間的字元,依舊是1個位元組代表1個字元。這一點是ansi編碼與unicode編碼之間最大也最明顯的區別。
而原來的editplus預設的是unicode編碼,這裡是沒有漢字的。所以,就會出現亂碼的問題。
編碼有幾種 ,計算機最初是在美國等國家發明的 所以表示字元只有簡單的幾個字母只要對字母進行編碼就好 我們標準碼 iso-8859-1 這就是乙個標準 但是後來計算機普及了,於是就中國要使用計算機了 但是機器不認得中文,於是就有了國際碼。 gbk gb2312都是這類。兩個其實乙個,乙個是標準(發布的代號),乙個是簡稱。後來多了個阿拉伯語、日語、韓語......所以就出來統一編碼unicode
iso-8859-1編碼是單位元組編碼,向下相容ascii,其編碼範圍是0x00-0xff,0x00-0x7f之間完全和ascii一致,0x80-0x9f之間是控制字元,0xa0-0xff之間是文字元號。此字符集主要支援歐洲使用的語言。
gbk: 漢字國標擴充套件碼,基本上採用了原來gb2312-80所有的漢字及碼位,並涵蓋了原unicode中所有的漢字20902,總共收錄了883個符號, 21003個漢字及提供了1894個造字碼位。windows 95系統就是以gbk為內碼,又由於gbk同時也涵蓋了unicode所有cjk漢字,所以也可以和unicode做一一對應。
我又聯想到在安裝一些軟體的時候,有乙個要求是目錄中不能帶有中文,這應該就是編碼的緣故。
各種編碼unicode、utf-8、ansi、ascii、gb2312、gbk詳解
命令提示符
cd 改變當前目錄 dir 顯示檔案列表 diskcopy 複製軟盤 format 格式化磁碟 md 建立子目錄 type 顯示檔案內容 rd 刪除目錄 ren 改變檔名 cls 清屏 正在執行命令的命令提示符 正在執行命令的命令提示符 適用場合 螢幕上太亂了,或是螢幕上出現亂碼了,清除螢幕上顯示內...
Linux shell命令提示符
如果您很容易使 shell 提示行變得色彩絢爛斕且帶有更多資訊,為什麼還要堅持用單調的標準 shell 提示行呢?在這篇技巧中,daniel robbins 將說明如何獲得符合您的意願的 shell 提示行,並會說明如何動態更新 x 終端的標題欄。作為 linux unix 人,我們有很長的時間是在...
CMD命令提示符
簡介 cmd是command的縮寫,即命令提示符 cmd 1 本質 命令提示符是在作業系統中,提示進行命令輸入的一種工作提示符。特性及快捷操作 1 dos作業系統使用者指令是不區分大小寫的。例如 dir dir dir的執行都是一樣的。2 快捷鍵 上下按鈕可以切換到之前輸入的指令 輸入部分檔名,按t...