Hive工作原理

2021-10-02 20:58:17 字數 466 閱讀 6445

. 使用者提交查詢等任務給driver。

編譯器獲得該使用者的任務plan。

編譯器compiler根據使用者任務去metastore中獲取需要的hive的元資料資訊。

編譯器compiler得到元資料資訊,對任務進行編譯,先將hiveql轉換為抽象語法樹,然後將抽象語法樹轉換成查詢塊,將查詢塊轉化為邏輯的查詢計畫,重寫邏輯查詢計畫,將邏輯計畫轉化為物理的計畫(mapreduce), 最後選擇最佳的策略。

將最終的計畫提交給driver。

driver將計畫plan轉交給executionengine去執行,獲取元資料資訊,提交給jobtracker或者sourcemanager執行該任務,任務會直接讀取hdfs中檔案進行相應的操作。

獲取執行的結果。

取得並返回執行結果。

Hive工作原理

hdfs中儲存的是資料 hive只裝在一台機器上,hive只是乙個工具乙個客戶端,而且他的資料時儲存在hdfs中的,只要hive能讀取hdfs的資料,能和msql進行互動底層就能轉換成mr程式,mr程式交給yarn之後就進行分布式執行了 hive來處理hdfs中儲存的結構化的靜態化資料,這個資料可以...

Hive工作模式

hive非互動模式 1 可以將hive執行的sql語句儲存到指令碼檔案中,通過 f選項指定指令碼檔案執行hive eg hive f script.sql 2 對於較短的sql語句,可以直接使用 e選項執行hive eg hive e select from table a 3 s選項 hive執行...

Hive 工作機制

hive 是乙個基於hadoop的乙個資料倉儲工具,可以將結構化的資料檔案對映為乙個表,並提供sql查詢功能,可將sql語句轉換為mapreduce任務進行。優點 學習成本低 可以通過類sql語句快速實現mapreduce統計。將清洗過的資料放入到hdfs中,就可以進行各種統計了 hive執行時,元...