一般轉換編碼都是用iconv命令來轉換,命令格式如下
$iconv -f gb18030 -t utf-8 file1.txt > file2.txt
說實話這個命令不好使,一方面容易重複轉換,另一方面不支援萬用字元,無法成批轉換,檔案少了還好說,要是一大堆檔案豈不是要累死?
於是在google上**,淘得乙個更好的傻瓜型命令列工具enca,它不但能智慧型的識別檔案的編碼,而且還支援成批轉換。
1.安裝
$sudo apt-get install enca
2.轉換
命令格式如下
$enca -l 當前語言 -x 目標編碼 檔名
例如要把當前目錄下的所有檔案都轉成utf-8
$enca -l zh_cn -x utf-8 *
很簡單吧。
不過用的時候發現有一部分檔案無法傳轉,具體原因不祥,不過enca會把無法轉換的檔案告訴你的。對於這些不能轉的檔案,可以用gedit另存為的方式轉,雖然這法笨點,但挺好使的。
出處:
上傳檔案亂碼,GBK轉UTF 8
最近遇到這樣乙個問題,我上傳檔案沒有轉換字符集windows預設gbk,結果當我需要讀檔案顯示時用utf 8轉當然會出現亂碼,為了解決這個問題,我就將上傳時檔案一同也轉成utf 8了這樣就不會亂碼了,上傳時轉換字符集方法如下 string root filepath 上傳路徑 file rootfi...
《轉》亂碼UTF8和UTF 8網頁編碼
曾經被字符集間複雜的轉換搞怕了,正好新專案要求國際化,需要能夠顯示多種語言,於是一開始就規定統統使用 utf 8 編碼。所有 檔案使用 utf 8 編碼存檔 mysql資料庫所有表,所有字段設定 collation 中文翻譯為 整理 屬性為 utf8 general ci 所有頁面輸出 即便是這樣,...
java gbk轉utf 8亂碼問題
最近在做乙個反饋功能,把資料反饋到對方公司 我公司是gbk編碼,對方公司是utf 8編碼。因此,我需要將gbk編碼資料轉換成utf 8編碼資料,這樣對方 才不會亂碼。最簡單的方法是將httpclient的contentcharset設定為utf 8 如果contentcharset是gbk並且又不想...