impala伺服器是乙個分布式、大規模並行處理(mpp)資料庫引擎。
執行在集群每個節點上的守護程序,名稱為impalad。
負責讀寫資料檔案;接受查詢請求,將查詢結果返回給中心協調者節點。
statestore搜尋集群中impalad程序節點的健康狀態,並不斷將健康狀態的結果**給所有的impalad程序節點。statestore程序的名稱為statestored。乙個impala集群只需要乙個statestored程序節點。
sql語句引起元資料變化時,catalog服務將變化推送到其他節點。名稱為catalogd,也是只需要乙個程序。
繼承apache hiveql的sql語法。
可以通過如下方式向impala提交請求:
* impala-shell 互動式命令列
* apache hue基於web的使用者介面
* jdbc
* odbc
impala和hive都是使用使用傳統的mysql或postgresql作為元資料庫儲存表定義資訊。
impala使用分布式檔案系統hdfs作為主要的資料儲存方式。
hbase是替代hdfs作為impala的資料儲存的另一種方式。
Impala之概念及架構
impala伺服器是乙個分布式,大規模並行處理 mpp 資料庫引擎。它包括執行在cdh集群主機上的不同後台程序。1,客戶端 有三類客戶端可以與impala進行互動 基於驅動程式的客戶端 odbc driver和jdbc driver,其中jdbc driver支援hive1與hive2風格的驅動形式...
Impala概念及架構解析
impala伺服器是乙個分布式 大規模並行處理 mpp 資料庫引擎。執行在集群每個節點上的守護程序,名稱為impalad。負責讀寫資料檔案 接受查詢請求,將查詢結果返回給中心協調者節點。statestore搜尋集群中impalad程序節點的健康狀態,並不斷將健康狀態的結果 給所有的impalad程序...
Spark 重要概念及相關知識點
看到這裡,恭喜你,結束了分布式儲存模組的內容,願此刻你已經把前面的章節都看透了,但是即便如此也還是不要鬆懈,接下來還有乙個大模組的內容。因為大資料的技術基本都是計算與儲存分離,各司其職,所以我們需要繼續來看分布式計算模組的內容,讓我們大資料面試的知識點更加完善。第一篇寫的是分布式計算界的中流砥柱,s...