第一種情況
一問題產生
在linux作業系統下,我們有時開啟在windows下的txt檔案,發現在windows下能正常顯示的txt檔案出現了中文亂碼。
二分析問題
出現這種情況的原因為兩種作業系統的中文壓縮方式不同,在windows環境中中文壓縮一般為gbk,而在linux環境中為utf8,這就導致了在windows下能正常顯示而在linux環境下開啟呈現了亂碼狀態。
三 解決方案:
在linux用iconv命令,如亂碼檔名為1-5.txt, 在終端輸入如下命令:
$ iconv -f gbk -t utf8 1-5.txt > 1-5.txt.utf8
發現重新生成了乙個1-5.txt.utf8檔案,開啟之後就能正常顯示中文了。
四 檢視結果:
$cat 1-5.txt.utf8
放入集群中
$hadoop fs -put 1-5.txt.utf8 /market
第二種情況
當 第一種方式無法解決時
首先excel**轉化為txt格式
用txt編譯器開啟該txt檔案 另存為utf-8格式即可
Hadoop Linux 開發環境搭建
官網relsease版本 開發環境搭建 1.安裝hadoop wget hadoop 2.7.2 hadoop 2.7.2.tar.gz tar xzvf hadoop 2.7.2.tar.gz 3.測試hadoop 檢視hadoop版本號 hadoop version 4.配置 hadoop每乙個...
linux下TXT顯示亂碼
一句話解決linux顯示windows中文txt亂碼的問題2009年12月03日 星期四 10 49前提是你的linux可以正常顯示中文,只是開啟windows txt檔案會有亂碼。原因是 linux下用的編碼一般是utf 8 windows 一般是gb2312 那麼只需要簡單的轉換下就可以正常顯示...
ubuntu下開啟txt檔案亂碼問題
ubuntu下開啟txt檔案,顯示亂碼,解決方法如下 方法一 終端輸入gconf editor調出gconf edit 如若沒安裝請用 sudo apt get install gconf editor 命令安裝 ps 輸入gconf editor即可,前面不需要加sudo 依次點開 在雙擊彈出對話...