Ubuntu下開啟檔案亂碼及編碼轉換

2022-05-03 03:09:10 字數 997 閱讀 1988

txt檔案在windows下可以正常顯示,ubuntu下開啟檔案亂碼。這是中文編碼問題,windows下用的是gb2312,而linux下用的是utf8。在此提供5種解決方案:

1. 在文件所在目錄執行命令

iconv -f gb2312 -t utf8 -c 1.txt > 2.txt

選項-c的作用是忽略不能識別的字元,繼續向後轉換。否則iconv遇到不能識別的字元就終止轉換。

iconv不能實現批量轉換,你需要寫一段小程式來達到此目的。

2.  執行命令

ubuntu預設的開啟.txt檔案用的是gedit,可gedit預設編碼是utf8,開啟windows下編輯的gb2312的文件都是亂碼。解決方法就是把gedit的預設編碼改為gb2312。

gconf-editor

雙擊encodings中的auto-detected

在彈開的對話方塊中加入gb2312

再將gb2312移到最上,退出。

3. 用openoffice開啟。檔案──開啟   開啟你想要開啟的.txt檔案,在開啟的時候會彈出視窗詢問要選擇何種字元。如圖選擇簡體中文(gb18030),(gb18030編碼向下相容gbk和gb2312,相容的含義是不僅字元相容,而且相同字元的編碼也相同。)則開啟之後會正常顯示了。只是每次都要詢問

4. 在windows上完成從gbk到uft-8的轉換,相對於方法1效果要好一些。具體方法如下:

f:\語料庫\tc-corpus-train\train>for /r c4-literature %i in (*.txt) do iconv.exe -f gbk -t utf-8 %i > %~ni.txt

5. 使用enca。

enca可自動判別原檔案的編碼型別,並且支援萬用字元,就此能實現批量轉換。

enca -l 原檔案語言型別 -x 目標編碼 原檔名

例如:enca -l zh_cn -x utf-8 file.txt

但是enca會經常遇到轉換失敗的情況,當然對於不能轉換的enca會給出錯誤報告。

ubuntu下開啟txt檔案亂碼問題

ubuntu下開啟txt檔案,顯示亂碼,解決方法如下 方法一 終端輸入gconf editor調出gconf edit 如若沒安裝請用 sudo apt get install gconf editor 命令安裝 ps 輸入gconf editor即可,前面不需要加sudo 依次點開 在雙擊彈出對話...

linux下解決檔案亂碼問題及檢視檔案編碼方法

linux下對檔案操作經常會遇見亂碼問題,我在網上搜了一些解決方法,希望能對大家有所幫助。如果你需要在linux中操作windows下的檔案,那麼你可能會經常遇到檔案編碼轉換的問題。windows中預設的檔案格式是gbk gb2312 而linux一般都是utf 8。下面介紹一下,在linux中如何...

ubuntu 下開啟 chm 檔案

一 chmsee 這個比較常見了,呵呵。安裝 sudo apt get install chmsee 之後在應用程式附件中就可以看到了。問題1 啟動不了或者出現 chmsee error while loading shared libraries libxul.so cannot open sha...