Hive技巧 選出某些列其餘所有的列

2021-08-16 05:49:43 字數 695 閱讀 9666

##hive中select除了某些字段之外的剩餘所有字段

這是hive中查詢語句的乙個小技巧,乙個表字段太多,我們想要除個別欄位外的剩餘所有字段,全部列出來看起來難受,實際上hive語句可以解決這個問題。

hive 0.13.0之後,select列表支援正規表示式

insert overwrite table tb2 partition

(dt=xx, hr=xx)

select

*from tb1 是不行的,因為後者是n個列,前者是n-

2個列

以前的做法

insert overwrite table tb2 partition

(dt=xx, hr=xx)

select c1, c2, c3, c4...

from tb1

如果欄位太多,乙個手敲那太麻煩的,我都是這麼幹的:在hue裡

現在可以採用,前提是

set hive.support.quoted.identifiers=none

insert overwrite table tb2 partition(dt=xx, hr=xx) select `(dt|hr)?+.+` from tb1

Hive使用技巧

最近的工作主要集中在資料分析,建立數倉並進行資料的分析,故記錄一些相關技巧 兩者多進行列轉行,使得乙個使用者的資料聚合到一起 不同點 collect set去重,collect list不去重 使用size 可以計算其中的類別個數 使用array contains str1,str2 判斷str1中...

Hive小技巧及優化

查詢除了ds 和 hr 之外的所有列 select ds hr from sales 修改表生命週期 odps alter table table name set lifecycle days 正則匹配 匹配除 n 之外的任何單個字元。要匹配包括 n 在內的任何字元,請使用像 n 的模式。解析執行...

hive之group by相關技巧

在使用hive進行分組查詢時,疑惑的一些地方進行驗證,特此記錄,也希望能給大家帶來一點幫助!hive進行分組查詢時,select多個字段,則也需要按該多個字段進行分組,例 selectyear,id type count 1 from tablename where 條件 group by year...