hive是什麼?要想將乙個東西使用好,必須首先對這個東西有乙個很正確的定位。
答案如下:hive是基於hadoop生態的上層應用,它提供了以下的特性:hive是乙個
資料倉儲工具
。hive是乙個可以用來便利
讀取、寫入、管理
海量資料集的資料倉儲工具。hive是乙個可以
使用sql語法
讀取、寫入、管理分布式儲存系統
上的海量資料集
的資料倉儲工具。
hive提供了標準的類sql規範,通過hiveql還支援使用者自定義udf、udaf、udtf函式。所以很強大!
hive不是為了進行oltp(online transaction processing)而設計,而是為了進行olap(online analysis processing),適合傳統的資料倉儲tasks的執行。
hive可以通過橫向增加機器數量,具有很好的拓展性、容錯性、鬆散連線性(多樣的input formats)。
hive的主要元件有:
hcatalog這是基於hadoop的乙個表和儲存的管理層,它允許使用者使用不同的處理工具如pig、mapreduce更好的以網格化的形式讀寫資料。
webhcat提供乙個服務允許使用者使用該服務執行mr作業,pig jobs,hive jobs,還可以通過http介面管理hive的元資料。
IT是個什麼玩意
的疑問掐到了關鍵點。但是想解開這個疑問,需要明析it在企業的作用。關於it,不宜分成國企 私企 外企。因為現在國企的競爭意識也挺強。雖然有國家特權資源在手,但也不是守著特權不思進取,而且在人才儲備上非常充裕,資金上也不差,市場意識也不錯,就是既有特權又因為特權而生的種種限制,所以手腳束縛。而外企,雖...
cache是個什麼玩意
cachearm920t有16k的資料cache和16k的指令cache,這兩個cache是基本相同的,資料cache多了一些寫回記憶體的機制,後面我們以資料cache為例來介紹cache的基本原理。我們已經知道,cache中的儲存單位是cache line,arm920t的乙個cache line...
raspberry是個什麼玩意
今天wilson同學取回乙個書本大小的包裹,說買回來一台小電腦,只有信用卡大小!這是第一次聽說和看見raspberry pi。聽說這玩意可以裝linux系統 聽說這玩意是乙個功能齊全的電腦 聽說這玩意可移動網際網路創業者執著地追逐著自己的 硬體夢 想要通過硬體創新改變移動網際網路。務器用 聽說這玩意...