各種環境下的編碼

2021-08-10 23:33:00 字數 717 閱讀 9721

1)作業系統的預設編碼方式

這是作業系統的內部屬性,比如大多數linux系統、mac os預設utf-8編碼,中文版windows系統預設gbk編碼。

2)終端的編碼方式

終端包括cmd、shell、terminal等,在與終端互動時,字元是要在終端顯示的,這必然涉及到終端採用的編碼方式,事實上有不少bug是在這個層面上產生的。對於單機系統而言,終端編碼與作業系統的編碼一般是一致的,但在遠端登入時,可能會遇到一些問題。

在windows中檢視**頁的方法:cmd中輸入chcp。

在linux中檢視**頁的方法:在終端中輸入locale 。

**頁是字符集編碼的別稱

下圖是本人在win10(英文版)中的演示:(bash為win10中自帶的linux子系統)

3)文字檔案的編碼方式

這是我們接觸最多的概念,即乙個文字檔案(如源**檔案)是以什麼編碼格式儲存的。大多數編碼器可以顯示文字的編碼格式,以及更改編碼方式重新儲存。

4)程式中的字元、字串變數的編碼方式

這與具體的程式語言相關,涉及到程式執行時變數在記憶體中的狀態。

windows環境下emacs各種外掛程式的安裝和使用

這裡的外掛程式主要是cedet,ecb,cscope,mew這幾種,網上還有很多其它外掛程式,大多是單個的el檔案,把它放到site lisp目錄下再在.emacs中載入就可以了,剛才所說的幾種,是檔案很多,看起來比較複雜的。不過在linux下安裝是非常容易的,都是.configure,make,m...

Python 各種編碼

問題 做twitter資料去停用詞的處理,遇到 unicodedecodeerror gbk codec can t decode byte 0xbf in position 2 illegal multibyte sequence 的錯誤 分析 終端預設的編碼格式是gbk當呼叫print函式將內容...

各種編碼彙總

1.解釋url編碼是一種瀏覽器用來打包表單輸入的格式 url 只能使用 ascii 字符集來通過網際網路進行傳送。由於 url 常常會包含 ascii 集合之外的字元,url 必須轉換為有效的 ascii 格式。url 編碼使用 其後跟隨兩位的十六進製制數來替換非 ascii 字元 url 不能包含...