在將csv檔案資料匯入hive資料倉儲時出現中文亂碼問題,現將解決方案記錄下
1, 先將csv檔案編碼設定為utf-8格式
2, 建立hive表
create
table
ifnot
exists tmp.sample_table (
id string,
name string
)row format serde 'org.apache.hadoop.hive.serde2.opencsvserde'
with serdeproperties (
'separatorchar'
=','
,'quotechar'
='"'
,'serialization.encoding'
='gbk'
)stored as textfile
tblproperties (
'skip.header.line.count'
='1'
);
3, 匯入csv資料至hive
hive -e "load data local inpath 'path' overwrite into table tmp.sample_table;"
4, 檢查資料是否正常 從CSV檔案匯入Hive出現中文亂碼問題解決
關於hive中文亂碼問題的解決辦法,網上有很多帖子,然而很多都是基於linux終端顯示字元的修改,其實上對於一些條件下的hive中文亂碼問題是無法解決的,如從csv檔案匯入到hive中出現的中文亂碼問題。大家都知道,hive原生的字元編碼是採用utf 8方式的,這是支援中文的。然而在從oracle匯...
將csv或者Excel檔案匯入到hive
1.將csv或excel檔案轉換為文字,以逗號或者製表符都可以 xigua.txt id,color,root,stroke,venation,umbilical,touch,status 1,青綠,蜷縮,濁響,清晰,凹陷,硬滑,是 2,烏黑,蜷縮,沉悶,清晰,凹陷,硬滑,是 3,烏黑,蜷縮,濁響,...
將虛擬機器本地csv檔案匯入hive
1 首先,先將windows系統下的csv檔案上傳到虛擬機器目錄中。我的是在 my dbdata 下 2 啟動hive,我提前建立了乙個名為toutiao的hive業務資料庫。建立時使用的命令 create database if not exists toutiao comment user,ne...