數倉工具 Hive函式大全 12

2021-10-13 02:49:35 字數 454 閱讀 6601

很多時候,我們需要對錶中的資料進行處理或者是想要完成某一邏輯的時候,單純的借助關鍵字組合起來的sql語句可能不能完成我們的需求,這個時候我們就需要特定的函式來幫助我們完成這樣的邏輯,如果沒有的話,我們可以嘗試定義已有的函式進行組合或者自定義函式來完成我們的需求。

hive內部提供了很多函式給開發者使用,包括數學函式,型別轉換函式,條件函式,字串函式,聚合函式,表生成函式等等,這些函式都統稱為內建函式,目前大概有289個函式。開始之前我們先看一下函式幫助函式

-- 檢視全部的函式

show functions;

-- 匹配特定名稱的單數

show functions like

'*date*'

;-- 檢視函式的描述資訊

desc

function datediff;

-- 檢視鍵鼠的詳細描述資訊

數倉工具 Hive初識 1

那麼,到底什麼是hive,我們先看看hive官網wiki是如何介紹hive的 apache hive是基於hadoop的乙個資料倉儲工具,可以將結構化的資料檔案對映為一張表,並且提供了通過sql 對儲存在分布式中的大型資料集的查詢和管理,主要提供以下功能 它提供了一系列的通過sql 訪問資料的工具,...

數倉工具 Hive關鍵字 11

關鍵字是任何一門語言中都要的一些字元,這些字元都有特殊的含義,一般情況下使用者不能直接使用的,因為編譯器對關鍵字是有特殊處理的。hive有一些保留的關鍵字,我們在執行一些語句時,不能將這些關鍵字作為識別符號 identifier 比如建表語句的表名或者欄位名 hive中有很多關鍵字,直接作為列名或者...

數倉工具 Hive高階之SerDe 6

serde是serializer deserializer的縮寫。序列化是物件轉換成位元組序列的過程。反序列化是位元組序列轉換成物件的過程。物件的序列化主要有兩種用途 hive使用serde介面完成io操作也就是資料的讀取和寫入,hive本身並不儲存資料,它用的是hdfs上儲存的檔案,在與hdfs的...