前言和talend這款軟體打交道有一段時間了,主要用它來做一些etl相關的作業開發,以下總結了一些自己配置與開發過程中的最佳實踐。
最佳實踐
可以通過修改talend studio 的.ini配置檔案來給其分配更多的記憶體,例如,以下是我在64位8gb記憶體的電腦配置的引數
-vmargs
-xms2014m
-xmx4096m
-xx:maxpermsize=512m
-dfile.encoding=utf-8
在開發過程中一定要注意對null值得處理
可以建立repository metadata用於資料庫連線
可以使用 t 的資料連線元件定義資料庫連線,並重複使用。
記得使用 t 元件來關閉資料庫連線
避免在talend的元件中在使用硬編碼值(hard coding),使用talend context 變數代替
盡可能使用變數代替硬編碼
對於頻繁的變換,可以通過建立routines或者functions來減少工作量
每次關機前記得儲存並關閉talend studio!!!
盡可能早的使用tfiltercolumns元件過濾去不需要的字段/列
盡可能早的使用tfilterrows元件過濾去不需要的資料
使用select列表示式從資料庫獲取資料,盡量避免獲取不需要的字段
當作業出現oom錯誤時,調整jvm的引數,例如修改xms和xmx來分配更多的記憶體
通過使用並行化選項來提高作業效能,減少整體的執行時間,如並行化從資料讀寫資料等
給main job起乙個有意義的名字
在定義sub job時,務必第一時間記錄子作業的標題、描述和目的。
在設計作業盡可能將複雜的作業切割成乙個個小作業
最佳實踐 Flutter 最佳實踐
最佳實踐是乙個領域可以接受的專業標準,對於任何程式語言來說,提高 質量 可讀性 可維護性和健壯性都非常重要。讓我們探索一些設計和開發flutter應用程式的最佳實踐。class enum typedef和extension應採用駝峰命名uppercamelcase規則。class mainscree...
ETL工具選型參考
目前主流的etl工具有kettle talend nifi datastage informatica cogons ssis等,其中nifi kettle和talend是開源軟體,其他均為商業軟體。開源軟體本身是不收費的,所以主要成本在培訓和諮詢方面,成本會維持在乙個相對較低的水平。商業軟體本身收...
JUnit最佳實踐
junit最佳實踐 cherami 轉貼 參與分 20053,專家分 4960 發表 2003 9 16 下午7 57 版本 1.0 閱讀 3899次 martin fowler說過 當你試圖列印輸出一些資訊或除錯乙個表示式時,寫一些測試 來替代那些傳統的方法。一開始,你會發現你總是要建立一些新的f...