1.資料倉儲業界是否該為
hadoop
的迅速崛起而感到擔憂甚至恐慌
?抑或是該向其敞開熱情的懷抱
?cloudera
公司的doug cutting
與hortonworks
公司的arun murthy
作為hadoop
領域的兩位先驅者,在本屆
hadoop 2014
峰會的問答環節中提出了這樣的問題。儘管很多企業開始將資料倉儲中的工作負載遷移到
hadoop
環境當中,但這種作法仍然沒有成為主流。但未來情況是否會有變化
?「如果相當比例的使用者不再增加資料倉儲的規模,反而由於發現了
hadoop
類系統在處理效率與負擔成本方面的優勢而對資料倉儲方案進行投資或者規模縮減處理,那我認為這確實應該算作一種威脅,」
cutting
解釋道。
2.資料倉儲和
hadoop
之間的主要區別是:資料倉儲通常部署在單個關聯式資料庫中,而這個資料庫則起到**儲存的作用。相比之下,
hadoop
及其hadoop
檔案系統是跨多個機器,並用來處理海量資料的,而這是任何單台機器都達不到的能力。
3.hive
hive 沒有專門的資料格式。 hive 可以很好的工作在 thrift 之上,控制分隔符,也允許使用者指定資料格式。
資料中颱與傳統資料倉儲對比
1 傳統資料倉儲的特點 2 資料中颱的優點 1.存檔海量資訊,歷史資料隨時可查。例如十年前的資料,如果沒有資料庫,想要找到是不容易的,可能存檔的紙質資料或者電腦資料早就丟失了。2.提高記錄和檢索資訊的效率。試想,如果是在一堆存檔了幾年的紙張合同裡找到一張合同是很麻煩的事,尤其是如果你僅僅知道某產品的...
Hadoop對資料倉儲的影響
在過去三年,hadoop生態系統已經大範圍擴充套件,很多主要it 商都推出了hadoop聯結器,以增強hadoop的頂層架構或是 商自己使用的hadoop發行版。鑑於hadoop的部署率呈指數級的增長,以及其生態系統不斷地深入而廣泛地發展,我們很想知道hadoop的崛起是否會導致傳統資料倉儲解決方案...
初識大資料(三 Hadoop與MPP資料倉儲)
mpp代表大規模並行處理,這是網格計算中所有單獨節點參與協調計算的方法。是將任務並行的分散到多個伺服器和節點上,在每個節點上計算完成後,將各自部分的結果彙總在一起得到最終的結果。mpp dbms是建立在這種方法之上的資料庫管理系統。在這些系統中的每個查詢都會被分解為由mpp網格的節點並行執行的一組協...