informatica是基於元資料驅動的,所有的元資料都儲存在repository(知識庫)中,該知識庫可以建立在所有主流資料庫當中,充分體現了它元資料的開放性。
repository server用來管理所有客戶端以及informatica server跟repository的互動, 並且乙個repository server可以管理多個repository,而repository server可為每個repository分配乙個repository agent來處理所對有元資料操作的響應。
informatica server是實際處理etl任務的後台服務,它是基於記憶體執行、高效的etl服務,不需要產生任何的**,每次執行任務之前都會從repository中讀取最新的etl規則。
informatica的客戶端提供了無編碼、完全圖形化的設計和管理排程介面,可實現快速開發和部署。
乙個基本的etl任務設計和部署的大致步驟如下:
(1) 使用designer客戶端,獲取源資料表的元資料。
(2) 使用designer客戶端,獲取目標資料表的元資料。
(5) 使用workflow manager客戶端,建立乙個workflow,其中包含上述的session以及其他的task,在workflow中可實現複雜的流程控制。
(6) 執行上述workflow,使用workflow monitor客戶端,監測最終的任務執行結果。
etl工具最近用的是informatica powercenter 8.1.1。總體來說,informaitca有四個開發管理元件,初學者可能不知道如何下手,所以關鍵先要了解powercenter的開發流程。
PowerCenter基礎心得
心得學習 通過將近一周的學習時間,我大致掌握了powercenter 的基本架構和設計開發過程中的一些方法和技巧。powcercenter 也是屬於典型的 c s 架構,分為伺服器元件和客戶端元件,服務端有三個服務 informatica service integration service 和 ...
PowerCenter學習心得
通過將近一周的學習時間,我大致掌握了powercenter 的基本架構和設計開發過程中的一些方法和技巧。powcercenter 也是屬於典型的 c s架構,分為伺服器元件和客戶端元件,服務端有三個服務 informatica service integration service 和reposit...
Power Center的架構跟簡介
整理筆記 emma.正文 網上能夠找到如下的圖 domain 是powercenter中所有伺服器物件以及服務物件的集合。最常見的物件包括節點,is integration service r repository service web service hub等。node 是物理伺服器在power...