基於某電商離線處理專案架構和實現一(處理流程)

2021-09-13 23:07:06 字數 849 閱讀 6683

hadoop:hdfs mapreduce(清洗) yarn、需要部署hadoop集群

hive:外部表、sql 、解決資料傾斜 、sql優化、基於元資料管理、sql 到mr過程

flume:將資料抽取到hdfs

排程:crontab、shell、azkaban

hue:視覺化的notebook,cm自帶 ,排查資料

大資料開發:關注的是2、3、4步驟。1,2,3都是屬於etl步驟,但是1可能是早就有的任務。

步驟1:使用flume/logstash抽取伺服器上的日誌資料以及使用sqoop/spark抽取關係型資料庫的資料將資料抽取到hdfs(壓縮+普通文字格式)。

步驟2:將hdfs上資料通過(mr/spark/flink)清洗處理後存放數倉(hive),此時

步驟3:將原始的資料放到目標位置,hive的外部表

步驟4:業務計算 將結果放到,業務表(資料集市)

步驟5:應用程式查詢訪問,我們這兒可通過hue檢視資訊

備註1

:hue是個非常強大且方便的視覺化介面。在介面能操作hadoop生態圈的元件以及查詢 查詢元件顯示資訊。使用場景:排查資料

備註2:

zeppelin和hue較類似的乙個工具,但是比hue好用,目前市場主流是以改z

eppelin原始碼去做自己的視覺化介面。

備註3:步驟2、3、4,的資料落地hdfs時,資料壓縮格式、資料的儲存格式選擇很重要

iOS電商專案金額輸入判斷處理

只能輸入數字和保留兩位小數,設定keyboardtype為uikeyboardtypedecimalpad即可 可以輸入0,繼續輸入數字則把0抹掉,輸入小數點則還可以繼續輸入兩位數字,不能輸入多個小數點 小數點前8位數字 小數點後2位 bool textfield uitextfield textf...

基於電商中臺架構 商品系統設計 一

二 概念定義 三 技術設計 四 總結 為什麼採用中臺架構前幾篇已經說明了,這裡就介紹一下基礎層和平台層的功能。商品管理 商品的基本操作 商品收藏 管理使用者收藏的商品 商品快照 儲存商品編輯的每乙個快照版本 活動打標 根據不同的活動對映到商品屬性上不同標記 銷量管理 商品的銷量統計 以及排序操作 瀏...

電商專案 基於json格式完成商品規格引數管理

學習主題 基於json格式完成商品規格引數管理 一對一json itemparamservice 介面新增方法 itemparamserviceimpl 重寫方法 manageritemparamservice介面新增方法 mnageritemparamserviceimpl 實現方法 建立 ite...