建立分割槽表
create external table 表名(id int,name string) partitioned by (name=username) row format delimiyed fields terminated by "\t" location '表名'
將檔案新增到分割槽表中
load data local inpath '檔案路徑名' into table 表名(hdfs上的表名) partition(name=username);
如果在子目錄自己已經上傳檔案,但是表沒顯示,是因為元資料庫中沒有記錄利用此命令;
alter table 表名(hdfs) add partition (name=username) location "hdfs的檔案路徑名"
新增jar
add jar "jar的路徑";
建立臨時函式;
create temporary function 自定義名 as "jar的包名加表名";
將hive的結果儲存到hdfs上;
insert overwrite directory "hdfs的檔案路徑名" row format delimited fields terminated by "\t" select user, login_time from user;
將hive的結果儲存到本地;
insert overwrite local directory "本地路徑名" select user, login_time from user_login;
還有一種,可以不進入hive中,直接執行,配好全域性變數;
hive -e "select user, login_timestamp from user_login" > 本地路徑名
儲存到hive表中;
首先建立好要儲存的hive表。
第乙個是建立好錶結構後,新增hive的結果到表中;
insert overwrite table hive表名 select user, login_time from user_login;
第二個是直接建立表,然後將結果新增進去;
create table 表名 as select user, login_time from user_login;
Hive學習筆記 Hive 引數
第一部分 hive 引數 hive.exec.max.created.files 說明 所有hive執行的map與reduce任務可以產生的檔案的和 預設值 100000 hive.exec.dynamic.partition 說明 是否為自動分割槽 預設值 false hive.mapred.re...
Hive學習筆記 Hive概述
1.1 資料倉儲 可以利用資料倉儲來儲存我們的資料,但是資料倉儲有別於我們常見的一般資料庫。資料倉儲是乙個面向主題的 整合的 不可更新的 隨時間不變化的資料整合,它用於支援企業或組織的決策分析處理。物件導向的 倉庫中的資料是按照一定的主題進行組織的。主題即使用者使用資料倉儲進行決策時所關心的重點方面...
hive基礎命令
小白上路嘍,從命令列開始 show database use db name show tables desc tb name show functions desc function fc name 執行hive sql指令碼 hive f script.sql 設定mapreduce 佇列 設定...