在hive中,編寫自定義udf函式,可以幫助我們更輕鬆的做etl。
例如,現在我要求某一列資料的平方,在eclipse新建工程,並新建乙個test包,在test包下新建乙個類square:
public class square extends udf
}
然後將**打成jar包,如:test01.jar。然後將這個jar包上傳到linux上。
在cli中輸入:
add jar /opt/test01.jar;
create temporay function squera as 'test.square'; // 定義函式別名,'test.square'為jar包中的包名加類名
select squera(id),name from my_udf; // 直接呼叫函式名來使用函式
hive自定義函式UDF
hive自定義函式 udf 可以幫助使用者輕鬆實現在hql語句中展現自定義查詢結果。這裡以乙個簡單的連線函式來實現使用者自定義函式,假設表結構如下 表中只有兩個簡單的字段,id和name。這裡實現乙個將id和name用 連線的函式,最後輸出結果。第一步 書寫stringjoin類,繼承udf,實現名...
hive自定義函式 UDF
幾個命令 檢視所有函式 hive show functions 檢視函式的使用方法 hive desc function 函式名 兩數和 addudf 自定義hive函式 description name myadd value myadd int a int b return a b extend...
hive自定義udf函式
在建立自定義函式時,需要將jar包全部部署到hive server節點的所有機器的使用者定義的udf引數目錄 hive.reloadable.aux.jars.path.jars.path.property property value usr lib hive lib value 呼叫 impor...