可以強制開啟排序
set hive.enforce.sorting=true;
或者使用其他sql的實現
使用其他sql的實現
set mapreduce.job.reduces=4;
建立表
create table if not exists buc3(
sno int,
sname string,
*** string,
sage int,
sdept string
)clustered by (sno) sorted by (sage desc) into 4 buckets
row format delimited
fields terminated by ','
stored as textfile
;
載入資料
insert overwrite table buc3
select * from t_stu
distribute by (sno) sort by (sage desc)
;
select * from buc3;
要保證有序,reduce數量必須和分桶數量一致
可以使用
set hive.enforce.sorting=true;
insert overwrite table buc2
select * from t_stu
cluster by (sno)
;
這種實現也保證資料是有序的
資料有序 資料運營部 有序推進重點專案建設
資料運營部 有序推進重點專案建設財務管控uap大版本公升級工作是2020年資料運營部重點工作之一,因省公司財務工作需求,要求於5月中旬完成該專案。該專案實施難度大,工期緊,為保證專案如期保質保量完成,資料運營部在疫情期間,一方面做好廠商人員防疫工作,另一方面了解業務部門業務需求,積極協調軟硬體資源和...
LinkedHashMap如何保證有序
我們常說linkedhashmap是有序的,這個有序也是分為兩種的,分別是 插入順序和訪問順序,我們可以通俗的認為 linkedhashmap hashmap 雙向鍊錶 以下的學習是基於jdk8 根據linkedhashmap的結構來看,是依賴於hashmap的,通過檢視原始碼,我們也會發現,lin...
kafka如何保證訊息有序
兩種方案 方案一,kafka topic 只設定乙個partition分割槽 方案二,producer將訊息傳送到指定partition分割槽 解析 方案一 kafka預設保證同乙個partition分區內的訊息是有序的,則可以設定topic只使用乙個分割槽,這樣訊息就是全域性有序,缺點是只能被co...