kettle的基本檔案有兩種,分別是轉換與作業,轉換中包含基本的資料操作邏輯,包含資料的讀取,加工與插入。
作業包含了轉換是將多個轉換彙總的檔案。
轉換是由控制項堆積出來的,控制項的種類很多。每種都有自己的作用,這裡介紹最常用的表輸入與表輸出。
表輸入是讀取關係型資料庫資料使用的控制項,可以選擇資料來源,並編寫sql。將根據sql內容查詢資料。
表輸出是將之前步驟(如表輸入)中獲取的資料插入關係型資料庫的控制項,也需要配置資料庫連線並其中最關鍵的部分是指定獲取的資料與目標資料庫之間欄位的對應關係。
在配置的資料來源是目標資料來源時為了提高效率應在編輯介面新增三個選項,插入效率可以提公升十倍左右
| rewritebatchedstatements |true |
|useserverprepstmts | false|
|usecompression | true |
mysql 的批量操作,要加rewritebatchedstatements引數
usecompression :與伺服器進行通訊時採用zlib壓縮(真/假)? 預設值為「假」。
useserverprepstmts:如果伺服器支援,是否使用伺服器端預處理語句? 預設值為「真」。
R提高篇 一 輸入輸出
目錄 文字輸出 split true 可將輸出同時傳送到螢幕和輸出檔案中 sink 結束重定向 圖形輸出 資料輸入 資料框輸出 文字匯入 匯入時預設把字元變數轉化為因子,若不希望這樣,則設定 stringasfactors false 若對匯入的每一列指定乙個類,可使用 colclasses 如 c...
常用技巧 輸入輸出優化 輸入輸出外掛程式
我們知道cin cout是比較慢的,不過它們可以加速。在 中加入這兩句即可 std ios sync with stdio false std cin.tie 0 加速過後cin的速度與scanf的速度近似 當然,加速過後就不要混用print和cout,scanf和cin了。因為不同步,後果會很嚴重...
檔案的輸入輸出如何管理
1.用命令和正確表示式按照要求建立檔案 用一條命令建立12個檔案westos classx linuxy x的數值範圍為1 2,y的數值範圍為1 6 這些檔案都包含在root使用者桌面的study目錄中 用一條命令建立8個檔案redhat versionx x的範圍為1 8 這些檔案都包含在 mnt...