1. 檢視hive版本號:
hive --version --------> 1.2.1
2. group by
可以通過字段所在的位置進行groupby:對於1.2.1版本:
set hive.groupby.orderby.position.alias = true;
沒有hive-287的版本,只能使用count(1)替代count(*),否則一樣
3. left semi join
只保留左表中的值,相當於以右表為基準對左表進行篩選
4.資料型別
hive
mysql
string
varchar
intint
hive-》mysql資料型別要一致
5. 建表及分割槽
hive可以建立分割槽表,mysql不需要。hive採用hdfs儲存,不能建立索引,mysql可以建立索引加快查詢。不同機制原理,淺淺了解下。
create table table_name (
col_name datatype,
...)comment 『some_description』
partition by(col_name datatype)
row format delimited
fields terminated by 『\t』;
內部表及外部表
load data [local] inpath 'filepath'
insert [overwrite] into table tablename
[partition (partcol1=val1, partcol2=val2 ...)]
select statement
into table tablename [partition (partcol1=val1, partcol2=val2 ...)]
hive基礎知識
接觸hive也有一段時間了,一直把它當做傳統的資料庫使用的,沒有出現問題。昨天的時候遇到乙個問題,就是hive表中的資料有重複了,領導讓盡快出方案解決,我想都沒想,直接脫口就說 把重複的刪除 同事告訴我說,hive不支援刪除。當時尷尬到家啦。無知太可怕了,趕緊學習總結一下hive。補補這方面的欠缺。...
Hive基礎知識學習
日期 2012 09 25 字型 大 中 小 1 hive是什麼 按照我的理解,hive 是乙個中間工具。它的主要作用是將 hql hive query language 轉換為一系列的 mapreduce job 利用hadoop 框架對資料進行類 sql處理。他的主要功能是在 hadoop 框架...
Hive基礎知識點總結 DML
向表中載入資料的基本語法 load data local inpath opt module datas student.txt overwrite into table student partition partcol1 val1,具體的引數介紹 1.load data 表示載入資料 2.loc...