hive自定義函式(udf),可以幫助使用者輕鬆實現在hql語句中展現自定義查詢結果。
這裡以乙個簡單的連線函式來實現使用者自定義函式,假設表結構如下:
表中只有兩個簡單的字段,id和name。這裡實現乙個將id和name用"-"連線的函式,最後輸出結果。
第一步、書寫stringjoin類,繼承udf,實現名稱為evaluate的方法;
書寫完成之後打包stringjoin.jar,準備上傳。
第二步、hive命令列下執行add jar /path/to/stringjoin.jar;
建立臨時函式.
create temporary function strjoin as "com.lenovo.hive.udf.stringjoin";這樣在hql語句中就可以使用strjoin函式了。這裡create temporary function時並沒有指定函式名,預設採用evaluate,所以
這個名字是固定的,不能隨便改動。在udf類中也並沒有找到evaluate這個方法,我猜測這個名字是hive固定寫法。
第三步、利用strjoin函式查詢結果。
結果和預期是一致的,udf函式生效了。
hive自定義函式 UDF
幾個命令 檢視所有函式 hive show functions 檢視函式的使用方法 hive desc function 函式名 兩數和 addudf 自定義hive函式 description name myadd value myadd int a int b return a b extend...
hive自定義udf函式
在建立自定義函式時,需要將jar包全部部署到hive server節點的所有機器的使用者定義的udf引數目錄 hive.reloadable.aux.jars.path.jars.path.property property value usr lib hive lib value 呼叫 impor...
Hive自定義UDF函式
匯入自定義udf.jar的第3種方式!匯入核心依賴 外部pom已經匯入了hadoop依賴!org.apache.hivegroupid hive execartifactid 1.2.1version dependency dependencies package com.zhengkw.userf...