lookup transformation優化技巧
1.當資料來源很大的時候,並且lookup表在50w行以下的時候,設定為cache方式的lookup,這將明顯的提公升效能10-20個百分點。
operations and expression optimizing tips
1.數字操作比字串快
2.優化字元型的比較(比如,在比較前用trim去掉空格)
3.操作符比函式快(比如,|| vs concat)
4.優化iif表示式
5.在lookup裡面避免使用date型別的條件。用string型別代替。
6.test expression timing by replacing with constant. 用常量代替什麼?
7.使用平板檔案
使用伺服器上的平板檔案快於該伺服器上的資料庫
定長的文字檔案快於裝載分隔符的檔案,因為分隔符需要花額外的解析成本。如果處理複雜的tansformation,可以考慮先把檔案裝載到關係型資料庫,這樣可以 利用filter過濾和也可以自定義的合適的select語句
8.如果不方便從源資料取得已經排序的資料(例如,weblogs),可以使用sorter advanced extenal procedure.
9.用router分離資料流,從而避免使用多個filter。
10.為了優化彙總的過程,可以在aggregator之前使用sorter或者採用hash-auto keys的分割槽方式。即使資料來源不能排序,也可以使用sorter transformation,就可以開啟sorted ports選項。
11.用normalizer transformation可以實現行到列
12. update strategy會把不符合條件的行儲存到乙個檔案中(bad file)。如果這些記錄不是必要的,可以在update strategy之前就過濾掉 ,因為保留這些記錄需要花費額外的成本。這時候在設定update strategy的引數為discard rejected rows.
13.當使用joiner transformation時候,確保master的資料量相對較小
14.在裝載到資料庫的過程中,如果必須要用update覆蓋的這種方式,可以在target之前用lookup transformation取得主鍵,根據主鍵的update大大快於沒有索引的lookup override。
Maping設計優化技術
align left size medium color darkred maping設計優化技術 描述對於優化的普遍建議 1 減少transformations的數量,資料流在各個transformation之間總會有一些消耗。2 考慮增加transformation的共享記憶體。比如sessio...
MySQL優化技術 3正規化的表設計
一 資料庫分類 關係型資料庫是通過行和列來將資料儲存在一張張資料表中,表與表之間存在資料關係。常用的關係型資料庫包括 mysql oracle sqlserver db2等 以鍵值對的形式來儲存資料,是一種物件導向 面向集合的資料儲存方式。常用的非關係型資料庫包括 nosql mongodb等 二 ...
頁面優化技術
瓶頸在資料庫。解決辦法加快取。快取 1.使用者在傳送請求時使用頁面的靜態化,把頁面快取在客戶端 2.請求還沒有到達 之前可以部署cdn節點,讓請求首先訪問cdn 3.可以使用nginx快取 4.接著在使用頁面級快取在詳細點可以使用物件快取 1.頁面快取 url快取 物件快取 使用頁面快取技術 手動渲...