Hadoop的應用場景

2021-06-28 11:58:16 字數 979 閱讀 2693

其實我們要知道大資料的實質特性:針對增量中海量的結構化,非結構化,半結構資料,在這種情況下,如何快速反覆計算挖掘出高效益的市場資料?

帶著這個問題滲透到業務中去分析,就知道hadoop需要應用到什麼業務場景了!!!如果關係型資料庫都能應付的工作還需要hadoop嗎?

比如1.銀行的信用卡業務,當你正在刷卡完一筆消費的那一瞬間,假如在你當天消費基礎上再消費滿某個額度,你就可以免費獲得某種令你非常滿意的利益等等,你可能就會心動再去消費,這樣就可能提高銀行信用卡業務,那麼這個消費額度是如何從海量的業務資料中以秒級的速度計算出該客戶的消費記錄,並及時反饋這個營銷資訊到客戶手中呢?這時候關係型資料庫計算出這個額度或許就需要幾分鐘甚至更多時間,就需要hadoop了,這就是所謂的「秒級營銷」. 針對真正的海量資料,一般不主張多表關聯。

2. 在**,當你瀏覽某個商品的時候,它會及時提示出你感興趣的同類商品的產品資訊和實時銷售情況,這或許也需要用到hadoop.

3. 就是報表用到的年度報告或者年度環比資料報告的時候也會用到hadoop去計算.

4.搜尋引擎分析的時候應該也會用到。乙個網友說過,其實還是看big data能否帶來多大的效益!比如銀行在躺著都賺錢的情況下,big data不一定是銀行的專案. 況且hadoop是新興技術,銀行業對新技術還是相對保守的.

hadoop 主要用於大資料的平行計算 平行計算按計算特徵分為:

hadoop主要應用於資料量大的離線場景。特徵為:

1、資料量大。一般真正線上用hadoop的,集群規模都在上百台到幾千臺的機器。這種情況下,t級別的資料也是很小的。coursera上一門課了有句話覺得很不錯:don't use hadoop, your data isn't that big

2、離線。mapreduce框架下,很難處理實時計算,作業都以日誌分析這樣的線下作業為主。另外,集群中一般都會有大量作業等待被排程,保證資源充分利用。

3、資料塊大。由於hdfs設計的特點,hadoop適合處理檔案塊大的檔案。大量的小檔案使用hadoop來處理效率會很低。

Hadoop下各技術應用場景

資料採集和dataflow 對於資料採集主要分為三類,即結構化資料庫採集,日誌和檔案採集,網頁採集。對於結構化資料庫,採用sqoop是合適的,可以實現結構化資料庫中資料並行批量入庫到hdfs儲存。對於網頁採集,前端可以採用nutch,全文檢索採用lucense,而實際資料儲存最好是入庫到hbase資...

hadoop排程器的原理和應用場景解析

前置篇 以下是對每個部件職責的更詳細解釋。resourcemanager 基於應用程式對資源的需求進行排程 每乙個應用程式需要不同型別的資源因此就需要不同的容器。資源包括 記憶體,cpu,磁碟,網路等等。資源管理器提供乙個排程策略的外掛程式,它負責將集群資源分配給多個佇列和應用程式。排程外掛程式可以...

SAP BTP MTA 應用的應用場景

程式語言 軟體設計架構 如微服務 協議 如 odata 的最新趨勢和進展,以及多層和分布式部署平台的多樣性,加速了由更多 更小 解耦和多樣化的模組構建應用程式的趨勢。在微服務架構下,越來越多的業務應用程式傾向於由使用不同語言和技術開發並部署到各種目標執行時環境的多個部分組成。這種應用程式模組的多樣性...