Linux下文字檔案編碼轉換

2021-10-07 07:49:58 字數 2216 閱讀 3568

[gbasedbt@centos7 iconv]$ echo $lang 

en_us.utf-8

新建的文字檔案格式也為utf-8

[gbasedbt@centos7 iconv]$ more ts_utf8.txt 

時間序列儲存在容器中,容器型別似於表,時間序列的資料是連續的。容器池是一組容器的集合。

滾動視窗容器的概念,相關活動視窗、休眠視窗,分割槽銷毀。

資料型別和系統表:

資料型別包括:calendarpattern、calendar、timeseries

系統表包括:calendarpatterns、 calendartable、tsinstancetable、tscontainertable

[gbasedbt@centos7 iconv]$ file ts_utf8.txt

ts_utf8.txt: utf-8 unicode text

[gbasedbt@centos7 iconv]$ iconv -f utf-8 -t gbk -o ts_utf8_2_gbk.txt ts_utf8.txt
說明:

-f 表示原始檔編碼格式

-t 表示目標檔案編碼格式

-o 表示輸出檔案的名稱

因為utf-8編碼中,漢字的編碼一般為3個位元組,而gbk中一般為2個位元組。故會有所差別。

[gbasedbt@centos7 iconv]$ ll

total 8

-rw-rw-r-- 1 gbasedbt gbasedbt 292 jun 18 19:59 ts_utf8_2_gbk.txt

-rw-rw-r-- 1 gbasedbt gbasedbt 388 jun 18 19:57 ts_utf8.txt

在linux作業系統中,需要環境中的lang與文字檔案編碼相容才能友好顯示。

如果使用的是xterm之類的終端,還需要設定終端的字符集與lang匹配,才能友好顯示。

[gbasedbt@centos7 iconv]$ echo $lang

zh_cn.gb18030

顯示文字內容,評估文字檔案的型別

[gbasedbt@centos7 iconv]$ more ts_utf8_2_gbk.txt 

時間序列儲存在容器中,容器型別似於表,時間序列的資料是連續的。容器池是一組容器的集合。

滾動視窗容器的概念,相關活動視窗、休眠視窗,分割槽銷毀。

資料型別和系統表:

資料型別包括:calendarpattern、calendar、timeseries

系統表包括:calendarpatterns、 calendartable、tsinstancetable、tscontainertable

[gbasedbt@centos7 iconv]$ file ts_utf8_2_gbk.txt

ts_utf8_2_gbk.txt: iso-8859 text

這裡顯示的文字檔案型別是iso-8859,而非utf-8。

同樣的,我們也可以將gbk轉換成utf-8格式

[gbasedbt@centos7 iconv]$ echo $lang

zh_cn.gb18030

[gbasedbt@centos7 iconv]$ iconv -f gbk -t utf-8 -o ts_utf8_2_gbk_2_utf8.txt ts_utf8_2_gbk.txt

[gbasedbt@centos7 iconv]$ ll

總用量 12

-rw-rw-r-- 1 gbasedbt gbasedbt 388 6月 18 20:33 ts_utf8_2_gbk_2_utf8.txt

-rw-rw-r-- 1 gbasedbt gbasedbt 292 6月 18 19:59 ts_utf8_2_gbk.txt

-rw-rw-r-- 1 gbasedbt gbasedbt 388 6月 18 19:57 ts_utf8.txt

[gbasedbt@centos7 iconv]$ file ts_utf8_2_gbk_2_utf8.txt

ts_utf8_2_gbk_2_utf8.txt: utf-8 unicode text

可以注意到生成的兩個utf-8檔案的編碼是一致的。

linux下文字檔案轉換編碼格式的方法

windows下我們一般是用editplus另存為的方法來轉換文字檔案的編碼方式,例如gb2312轉換成utf8,utf8轉換成gbk等等。在linux,有乙個專門的命令用來執行編碼轉換,它就是iconv,iconv有幾個典型的引數 f,即from,表示檔案的原始編碼 t,即to,表示要轉換成什麼編...

高速清空linux下文字檔案內容

1.root desktop huage filename 是乙個佔位符。不會產生不論什麼輸入 2.root desktop huage filename 相同不會產生不論什麼輸出 3.root desktop huage echo filename 會看到一行空行。檔案大小是1byte 4.roo...

快速清空linux下文字檔案內容

1.root desktop huage filename 是乙個佔位符,不會產生任何輸入 2.root desktop huage filename 同樣不會產生任何輸出 3.root desktop huage echo filename 會看到一行空行,檔案大小是1byte 4.root de...