二、環境搭建?
1
b) build.xml
(line 61)?
1
<
param
name
=
"hadoop.version.ant-internal"
value
=
"0.20.2"
/>
三、用法和例子
1, 建立表?
1
2
3
4
5
6
create
table
page_view(viewtime
int
, userid
bigint
,
page_url string, referrer_url string,
ip string comment
'ip address of the user'
)
comment
'this is the page view table'
partitioned
by
(dt string, country string)
stored
as
sequencefile;
partitioned by 是建立分割槽(什麼是分割槽?下邊說明)
沒有指定字段分隔符的話, 預設是使用^a(ctrl-a)為字段分隔符, 換行為記錄分隔符. 指定分隔符用row format row_format 語句
分割槽: partitioned by , 其實就是在資料的目錄下, 用不同目錄來區分, 比如, dt, 就是按日期(date)來區分, country 國家, hour 小時等等.對應的會在資料的目錄下有分割槽目錄. 可以建雙分割槽, 就是子目錄下再分割槽(其實就是一棵目錄樹).
參考:
高階用法:
搭建hive環境
搭建好hadoop環境後開始搭建hive環境。搭建hive過程中也遇到了很多坑,所以記錄下來。上傳hive到伺服器之後,要配置環境變數,需要涉及到三個地方。由於照著搭建的教程中只讓改了兩個,導致沒有啟動成功。需要配置的檔案分別是 hive conf hive env.sh hive conf hiv...
windows下hive環境搭建
先說一句,不建議在windows下搭建hive,感覺沒必要,坑比較多,讓我有了租雲伺服器的衝動!一 準備工作 之前我們已經安裝好了hadoop,根據網上的教程,還需要乙個hadoop.dll檔案需要扔到hadoop的bin目錄,git上可以找到。hadoop可以正常啟動。二 安裝hive 因為had...
Python入門 環境搭建與IDE
python版本有2.x和3.x,python 3是對python 2 的乙個非常大的公升級,包括python最常遇到的編碼問題,python 3 採用國際常用編碼 utf 8 成根本上解決很多語言的亂碼問題。不需要過多的理由,新手學習python3就沒錯,現在很多python類庫都已經逐漸不開始對...