Linux系統下轉換檔案編碼的方法

2021-09-20 23:29:43 字數 2199 閱讀 2441

1.利用iconv命令進行檔案內容編碼轉換

用法: iconv [選項...] [檔案...]

有如下選項可用:

輸入/輸出格式規範:

-f, --from-code=名稱 原始文字編碼

-t, --to-code=名稱 輸出編碼

資訊:-l, --list 列舉所有已知的字符集

輸出控制:

-c 從輸出中忽略無效的字元

-o, --output=file 輸出檔案

-s, --silent 關閉警告

--verbose 列印進度資訊

-?, --help 給出該系統求助列表

--usage 給出簡要的用法資訊

-v, --version 列印程式版本號

eg:

1

iconv -f gb2312 -t utf-8 1.txt > 2.txt

這個命令讀取1.txt檔案,從gb2312編碼轉換為utf-8編碼,其輸出定向到2.txt檔案。

注:windows下寫字板生成的txt一般是gb18030編碼,如果指定錯誤會報如下錯誤:

iconv: 未知 6071 處的非法輸入序列

2.檔名編碼轉換

因為現在用linux,原來在windows裡的檔案都是用gbk編碼的。所以copy到linux下是亂碼,檔案內容可以用iconv來轉換可是好多中文的檔名還是亂碼,找到個可以轉換檔名編碼的命令,就是convmv。

convmv命令詳細引數

eg:1

convmv -f gbk -t utf-8 *.***

不過這個命令不會直正的轉換,你可以看到轉換前後的對比。如果要直正的轉換要加上引數 --notest 1

convmv -f gbk -t utf-8 --notest *.***

-f 引數是指出轉換前的編碼,-t 是轉換後的編碼。這個千萬不要弄錯了。不然可能還是亂碼哦。還有乙個引數很有用。就是 -r 這個表示遞迴轉換當前目錄下的所有子目錄。

* 需要安裝 convmv-1.10-1.el5.noarch.rpm

3.傻瓜型命令列工具enca

安裝:1

yuminstallenca -y

檢視當前檔案編碼 1

2

3

enca -l zh_cn ip.txt

simplified chinese national standard; gb2312

surrounded by/intermixedwith non-text data

檔案格式轉換:

1

enca -l zh_cn -x utf-8 *

1

2

檢查檔案的編碼

enca -l zh_cnfile

將檔案編碼轉換為"utf-8"編碼  1

enca -l zh_cn -x utf-8 file

如果不想覆蓋原檔案可以這樣,這樣: 1

enca -l zh_cn -x utf-8 < file1 > file2

檢視編碼的方法:

a.1

2

filefilename

b.在vim中可以直接檢視檔案編碼

1:setfileencoding

Linux下轉換檔案編碼格式的方式

set fileencoding 即可顯示檔案編碼格式。2 改寫 vimrc 檔案 如果你只是想檢視其它編碼格式的檔案或者想解決用vim檢視檔案亂碼的問題,那麼你可以在 vimrc 檔案中新增以下內容 set encoding utf 8 fileencodings ucs bom,utf 8,cp...

(編碼轉換)轉換檔案編碼

目錄 1 轉換編碼種類 2 轉編碼操作步驟 1 轉換編碼種類 可轉為 utf 8 最常用 ansi unicode unicode big endian 這四類編碼 2 轉換編碼操作步驟 1 將檔案以記事本方式開啟 注意 如果不可以請先將檔案轉換為 csv 檔案,再以記事本開啟 2 點選記事本左上方...

Mac下轉換檔案編碼格式

win下檔案預設使用gbk編碼,而mac下是utf 8,難免遇到亂碼的情況,可以通過終端iconv命令解決。單個檔案轉碼 iconv f 原編碼格式 t 新編碼格式 原路徑 新路徑 iconv f gbk t utf 8 users ypf downloads 恐怖廣播.txt users ypf ...