官方定義:the apache hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using sql.
即:hive是一種用類sql語句來協助讀寫、管理那些儲存在分布式儲存系統上大資料集的資料倉儲軟體
hive作為hadoop的乙個資料倉儲工具,hive可以將結構化的資料檔案對映為一張資料庫表,並提供簡單的sql查詢功能。如若像我一樣暫不需要深入接觸大資料的話,了解hive是hadoop的乙個資料倉儲工具,提供大資料sql查詢功能,並且hivesql語法類似sql。
資料型別長度備註,例子
tinyint
1位元組的有符號整數
-128~127,20
smallint
1個位元組的有符號整數
-32768~32767,20
int4個位元組的有符號整數
-2147483648 ~ 2147483647,20
bigint
8個位元組的有符號整數
,20boolean
布林型別,true或者false
true、false,true
float
單精度浮點數
,3.14159
double
雙精度浮點數
,3.14159
string
字串,'hello word' "hello word "
timestamp
整數支援unix timestamp,可以達到納秒精度
binary
位元組陣列
date
日期0000-01-01 ~ 9999-12-31,常用string代替
------
struct
類似 『物件』
struct('john','doe')
map一組鍵-值對元組組合
map('first','join','last','doe')
array
陣列是一組具有相同型別對和名稱對變數對集合。
array('john','doe')
------
hive本身可能就是為了讓會sql的人快速使用hadoop進行資料操作,所以hivesql和sql語法大體一致,遇到不同的地方再補充。
hive基礎入門
現在還沒有上專案,就將自己以前自學大資料裡關於hive方面基礎的東西整理拉下,也算是對學過的知識的一種複習,順便分享出來與各位大佬共勉,有問題的話請不吝賜教。建立分割槽表 create external table if not exists log empno int,ename string,j...
Hive 學習記錄 入門基礎
一 常用ddl 建表 create external table if not exists table name col name data type comment col comment comment table comment partitioned by col name data ty...
Hive使用入門
先介紹一些基本的命令 1 進入hive命令列,這種方式進入之後,操作結果展示時帶有執行mapreduce的除錯資訊 hive service cli 等同於直接輸入hive 2 進入hive命令列靜默模式,不輸出除錯資訊 hive s 靜默模式 3 檢視表資訊,檢視函式資訊,檢視表字段資訊,每一條h...