先把檔案放入hdfs,或用flume採集到hdfs,參看另一篇,再把hdfs檔案載入到hive表中
alter table ods_nshop.ods_01_releasedatas add partition (bdp_day='20191215') location 'hdfs://hadoop01:9000/data/nshop/ods/release/bdp_day=20191215'
hive的表如下:
create external table if not exists ods_nshop.ods_01_releasedatas(
customer_id string comment '使用者id',
device_num string comment '裝置號',
device_type string comment '裝置型別',
os string comment '手機系統',
os_version string comment '手機系統版本',
manufacturer string comment '手機製造商',
area_code string comment '地區編碼',
release_sid string comment '投放請求id',
release_session string comment '投放會話id',
release_sources string comment '投放渠道',
release_params string comment '投放請求引數',
ct bigint comment '建立時間'
) partitioned by (bdp_day string)
row format delimited
fields terminated by ','
stored as textfile
location '/data/nshop/ods/release/'
將hdfs檔案匯入hive表
hive sql對hdfs的操作最終都會轉化為mr任務,下面介紹如何將已經存在的hdfs檔案 匯入 hive表,很簡單 條件及要求 1 hdfs檔案為經過lzo壓縮的seqfile 2 seqfile資料樣例 3 hive表是外在分割槽表 步驟1.建立hive表 其中external和partiti...
將hdfs資料寫入hive
下面來嘮嘮怎麼將hdfs裡的資料寫入到hive裡。要將資料寫入hive裡,那麼hive裡得有存放資料表得位置,因此,第一步,是在hive裡建立新的表來儲存來自hdfs的資料,這裡有兩個注意 1 新建的表應該跟hdfs裡面資料表一致,指定列名 2 建立 式應一致,具體就是指row format del...
hive讀取hdfs存放檔案 Hive基本概念
hive是基於hadoop的乙個資料倉儲工具,可以將結構化的資料檔案對映為一張資料庫表,並提供類sql查詢功能。人員學習成本太高 專案週期要求太短 mapreduce實現複雜查詢邏輯開發難度太大 操作介面採用類sql語法,提供快速開發的能力。避免了去寫mapreduce,減少開發人員的學習成本。擴充...