HIVE 1 基礎操作。

2021-07-15 08:14:01 字數 2073 閱讀 6898

#建立新錶

hive> create table t_hive (a int, b int, c int) row format delimited fields terminated by '\t';

#匯入資料t_hive.txt到t_hive表

hive> load data local inpath '/home/cos/demo/t_hive.txt' overwrite into table t_hive ;

#正則匹配表名

hive>show tables '*t*';

#增加乙個字段

hive> alter table t_hive add columns (new_col string);

#重命令表名

hive> alter table t_hive rename to t_hadoop;

#從hdfs載入資料

hive> load data inpath '/user/hive/warehouse/t_hive/t_hive.txt' overwrite into table t_hive2;

#從其他表匯入資料

hive> insert overwrite table t_hive2 select * from t_hive ;

#建立表並從其他表匯入資料

hive> create table t_hive as select * from t_hive2 ;

#僅複製表結構不導資料

hive> create table t_hive3 like t_hive;

#通過hive匯出到本地檔案系統

hive> insert overwrite local directory '/tmp/t_hive' select * from t_hive;

#hive查詢hiveql

from ( select b,c as c2 from t_hive) t select t.b, t.c2 limit 2;

select b,c from t_hive limit 2;

#建立檢視

hive> create view v_hive as select a,b from t_hive;

#刪表drop table if exists t_hft;

#建立分割槽表

drop table if exists t_hft;

create table t_hft(

securityid string,

tradetime string,

preclosepx double

) partitioned by (tradedate int)

row format delimited fields terminated by ',';

#匯入分割槽資料

hive> load data local inpath '/home/bluebreeze/data/t_hft_1.csv' overwrite into table t_hft partition(tradedate=20130627);

#檢視分割槽表

hive> show partitions t_hft;

#刪除表內容

insert overwrite table t_table1 select * from t_table1 where ***x;

其中***是你需要保留的資料的查詢條件。

如果清空表,如下:

insert overwrite table t_table1 select * from t_table1 where 1=0;

hive的匯入資料一點都不能差多乙個空格都不行。就算看不出也有可能出錯。上圖
分享

|2015-01-06 14:55

勤奮的caijigen

|瀏覽 2099 次

資料庫軟體開發

程式語言

我想在乙個表裡面加一條資料
2015-01-09 19:04

網友採納

hive沒有 行級別的插入,更新和刪除操作,往表中插入資料的唯一方法就是 使用成批載入操作。

Hive 1 資料倉儲

資料倉儲 data warehouse dw dwh 資料倉儲的目的 構建面向分析的整合化資料環境。名字叫做data warehourse 資料倉儲 倉庫 主要用於儲存東西的,不會生產東西,也不會消耗東西 資料倉儲 不會產生任何的資料,也不會消耗任何的資料,只是用於儲存這些資料 主要用於分析性報告和...

Hive 1 數倉和Hive基本概念

資料倉儲的分層架構 資料倉儲分層的目的 數倉的三層架構 數倉的四層架構 etlhive概念 hive的互動方式 非易失性 資料進入數倉後,基本不會被修改 時變性 分析資料的手段 工具 可能會變 數倉的出現並不是要取代資料庫,數倉是在資料庫已經大量存在的情況下,為了進一步挖掘資料來決策而產生的,數倉絕...

hive1公升級hive2使用RCFile內容錯亂

由於在hive1中使用的rcfile格式儲存並且沒有指定serde,當把資料檔案拷貝的hive2的目錄下查詢時發現資料錯亂 原因 hive1不指定serde預設採用org.apache.hadoop.hive.serde2.columnar.lazybinarycolumnarserde hive2...