1.利用iconv命令進行檔案內容編碼轉換
用法: iconv [選項...] [檔案...]
有如下選項可用:
輸入/輸出格式規範:
-f, --from-code=名稱 原始文字編碼
-t, --to-code=名稱 輸出編碼
資訊:-l, --list 列舉所有已知的字符集
輸出控制:
-c 從輸出中忽略無效的字元
-o, --output=file 輸出檔案
-s, --silent 關閉警告
--verbose 列印進度資訊
-?, --help 給出該系統求助列表
--usage 給出簡要的用法資訊
-v, --version 列印程式版本號
eg:
1
iconv -f gb2312 -t utf-8 1.txt > 2.txt
這個命令讀取1.txt檔案,從gb2312編碼轉換為utf-8編碼,其輸出定向到2.txt檔案。
注:windows下寫字板生成的txt一般是gb18030編碼,如果指定錯誤會報如下錯誤:
iconv: 未知 6071 處的非法輸入序列
2.檔名編碼轉換
因為現在用linux,原來在windows裡的檔案都是用gbk編碼的。所以copy到linux下是亂碼,檔案內容可以用iconv來轉換可是好多中文的檔名還是亂碼,找到個可以轉換檔名編碼的命令,就是convmv。
convmv命令詳細引數
eg:1
convmv -f gbk -t utf-8 *.***
不過這個命令不會直正的轉換,你可以看到轉換前後的對比。如果要直正的轉換要加上引數 --notest 1
convmv -f gbk -t utf-8 --notest *.***
-f 引數是指出轉換前的編碼,-t 是轉換後的編碼。這個千萬不要弄錯了。不然可能還是亂碼哦。還有乙個引數很有用。就是 -r 這個表示遞迴轉換當前目錄下的所有子目錄。
* 需要安裝 convmv-1.10-1.el5.noarch.rpm
3.傻瓜型命令列工具enca
安裝:1
yum
install
enca -y
檢視當前檔案編碼 1
2
3
enca -l zh_cn ip.txt
simplified chinese national standard; gb2312
surrounded by
/intermixed
with non-text data
檔案格式轉換:
1
enca -l zh_cn -x utf-8 *
1
2
檢查檔案的編碼
enca -l zh_cn
file
將檔案編碼轉換為"utf-8"編碼 1
enca -l zh_cn -x utf-8 file
如果不想覆蓋原檔案可以這樣,這樣: 1
enca -l zh_cn -x utf-8 < file1 > file2
檢視編碼的方法:
a.1
2
file
filename
b.在vim中可以直接檢視檔案編碼
1:
set
fileencoding
Linux下轉換檔案編碼格式的方式
set fileencoding 即可顯示檔案編碼格式。2 改寫 vimrc 檔案 如果你只是想檢視其它編碼格式的檔案或者想解決用vim檢視檔案亂碼的問題,那麼你可以在 vimrc 檔案中新增以下內容 set encoding utf 8 fileencodings ucs bom,utf 8,cp...
(編碼轉換)轉換檔案編碼
目錄 1 轉換編碼種類 2 轉編碼操作步驟 1 轉換編碼種類 可轉為 utf 8 最常用 ansi unicode unicode big endian 這四類編碼 2 轉換編碼操作步驟 1 將檔案以記事本方式開啟 注意 如果不可以請先將檔案轉換為 csv 檔案,再以記事本開啟 2 點選記事本左上方...
Mac下轉換檔案編碼格式
win下檔案預設使用gbk編碼,而mac下是utf 8,難免遇到亂碼的情況,可以通過終端iconv命令解決。單個檔案轉碼 iconv f 原編碼格式 t 新編碼格式 原路徑 新路徑 iconv f gbk t utf 8 users ypf downloads 恐怖廣播.txt users ypf ...