hive MV速度慢的問題

2021-07-22 08:26:35 字數 626 閱讀 7457

事件: 執行乙個hive查詢,在執行到 hive 的 moving data 過程就卡住了,早上來的時候看執行還在那個位置。

截圖如下:

處理方法:在hive-site.xml中新增以下引數。

hive.exec.stagingdir

/tmp/hive/.hive-staging

這個引數預設是會在輸出目標目錄下先建立乙個sessionid目錄用於臨時存放執行結果。

hive最後在mv的時候,原目錄是目標目錄的子目錄,原目錄下的每個檔案進行copy操作,如果檔案大於預設值(32mb),則會進行distcp操作。如果copy操作,那麼資料經過客戶端讀寫一次,如果distcp那麼會提交乙個任務,不論哪種速度都會非常慢。

hive的mv策略如下:

1.原檔案是非hdfs檔案,copyfromlocal

2.原檔案是hdfs檔案

2.1   encrypted模式

copy操作,如果檔案大於預設值(32mb),則會進行distcp操作。

2.2  非encrypted模式

(1)原目錄是目標目錄的子目錄,原目錄下的每個檔案進行copy操作,如果檔案大於預設值(32mb),則會進行distcp操作。

(2)其他情況,進行mv操作。

連線ssh速度慢的問題

今天安裝虛擬機器,發現ssh本地連線上去,速度非常慢,慢的難以忍受,大概30秒左右。後來到網上查了下,嘗試了一種辦法,效果還可以,特發上來給大家共享。xiezhanhui localhost vi etc ssh sshd config 修改 usedns yes 為 usedns no 如果沒有這...

連線ssh速度慢的問題

今天安裝虛擬機器,發現ssh本地連線上去,速度非常慢,慢的難以忍受,大概30秒左右。後來到網上查了下,嘗試了一種辦法,效果還可以,特發上來給大家共享。xiezhanhui localhost vi etc ssh sshd config 修改 usedns yes 為 usedns no 如果沒有這...

FTP的速度慢

最近發現在在家裡上傳到ftp的速度很不正常,小檔案上傳簡直就是悲劇,一上傳速度就變成0,測試了大檔案一開始速度正常然後開始變慢,速度到0,過幾秒鐘後速度才恢復。一開始以為是ftp伺服器故障,檢查了很多設定,包括重新編譯依然無效。但是發現在單位正常。之後查閱了很多相關資料,發現居然和mtu值有關,預設...