ubuntu下亂碼問題解決方案
txt檔案在windows下可以正常顯示,ubuntu下開啟檔案亂碼。這是中文編碼問題,windows下用的是gb2312,而linux下用的是utf8。在此提供5種解決方案:
1. 在文件所在目錄執行命令 www.2cto.com
iconv -f gb2312 -t utf8 -c 1.txt > 2.txt
選項-c的作用是忽略不能識別的字元,繼續向後轉換。否則iconv遇到不能識別的字元就終止轉換。
iconv不能實現批量轉換,你需要寫一段小程式來達到此目的。
2. 執行命令
ubuntu預設的開啟.txt檔案用的是gedit,可gedit預設編碼是utf8,開啟windows下編輯的gb2312的文件都是亂碼。解決方法就是把gedit的預設編碼改為gb2312。
gconf-editor
然後點開:apps->gedit-2->preferences->encodings
雙擊encodings中的auto-detected
在彈開的對話方塊中加入gb2312
再將gb2312移到最上,退出。
3. 用openoffice開啟。檔案──開啟 開啟你想要開啟的.txt檔案,在開啟的時候會彈出視窗詢問要選擇何種字元。如圖選擇簡體中文(gb18030),(gb18030編碼向下相容gbk和gb2312,相容的含義是不僅字元相容,而且相同字元的編碼也相同。)則開啟之後會正常顯示了。只是每次都要詢問
4. 在windows上完成從gbk到uft-8的轉換,相對於方法1效果要好一些。具體方法如下:
f:\語料庫\tc-corpus-train\train>for /r c4-literature %i in (*.txt) do iconv.exe -f gbk -t utf-8 %i > %~ni.txt
5. 使用enca。
enca可自動判別原檔案的編碼型別,並且支援萬用字元,就此能實現批量轉換。
enca -l 原檔案語言型別 -x 目標編碼 原檔名
例如:enca -l zh_cn -x utf-8 file.txt
但是enca會經常遇到轉換失敗的情況,當然對於不能轉換的enca會給出錯誤報告。
linux下中文亂碼問題解決方案
從windows傳過來的檔案拷到linux下是亂碼,俺們又想在linux下顯示中文,怎麼辦呢?我們首先進行測試,linux下的中文是否可以正常顯示?答 yes.所以問題就比較明顯了,windows下拷過來的不能顯示,說明windows下和linux下支援的格式是不相同的.linux下一般是採用utf...
Ajax post亂碼問題解決方案
今天測試乙個ajax元件的時候遇到亂碼問題,在網上找了很多解決方案都未能解決,原因可能我出現亂碼的問題不在傳輸過程,而且是在頁面上就已經出現亂碼了,現象很奇怪,我直接把引數賦值為中文後alert,發現是亂碼,所以不管我怎麼設定和在後台解碼都依然是亂碼。後來找到原因,共分兩點 第一 我的meta標籤設...
python Django 亂碼問題解決方案
亂碼問題 1,插入資料庫亂碼,檔案前加入 import sys reload sys sys.setdefaultencoding utf8 同時保證資料庫介面是utf8的 mysql alter database databasename default character set utf8 co...