關於資料遷移的方法、步驟和心得
在專案中經常會遇到系統完全更換後的歷史資料遷移問題,以示對客戶歷史工作的尊重,何況很多資料仍有保留的必要。
那怎麼做歷史資料遷移呢?
系統分析:
1、分析原有的業務系統
精確到大致的系統功能模組、大致的處理流程即可
2、分析現有的業務系統
精確到大致的系統功能模組、大致的處理流程即可
3、分析兩者自己的區別和差異
大致分析一下兩個業務系統之間的區別,有助於確定工作量和工作進度
4、分析使用者對舊有資料的需求
分析對舊有資料的需求,才不至於盲目的全部性的進行遷移
5、分析使用者對舊有資料的處理規則
舊有資料的處理規則,一般分為以下幾類:
1、基礎資料,通常這一類容易遷移,資料格式簡單,但是會影響所有的相關業務資料,關注點為資料的主鍵和唯一鍵的方式。
2、純歷史資料的匯入,僅供參考用的,這一類資料匯入容易
2.1 純歷史資料
這一類資料處理起來會比較容易,一次性匯入即可,後續採用增量資料匯入。
2.2 流程性資料
這一類資料只有在記錄完全關閉後才能結束,需要進行增量匯入和資料更新,同時還要進行相關查詢介面的開發,以保證舊有資料能夠在新系統中查詢的到。
3、新老系統表結構變化較大的歷史資料
這一類資料的工作量是最重的,就需要仔細去研究新老業務系統的資料結構了。
1、盡量通過甲方單位來收集齊全相關原系統的相關設計文件,這一點對資料分析很有幫助,通過人的感覺和對資料的觀察來分析畢竟不太靠譜。
2、在原系統上進行相關資料的觀察,了解資料的變化和資料表資料的關係(對於比較難以理解的相關欄位很有幫助)
3、比較新老系統資料的差異,如果實在很不靠譜的話,建議按2.2去處理。
系統設計:
1、做完系統分析之後,對相關資料進行歸類,基礎資料、純歷史資料、變化較大的歷史資料
2、先從簡單的入手,給自己點信心
3、在excel表中進行相關表的資料字典對照,勾畫出對應字段、轉換邏輯、依賴關係、必要時在新系統表上做相應的冗餘,等資料遷移完畢後再清除。
關鍵點:
不同資料庫的字段型別的匹配問題,比如sqlserver的text,在oracle應該對應clob,但是寧願轉換成幾個varchar2,從實現角度相對容易些。
關於主鍵的問題,一致的資料型別盡量維持現有狀態,不一致的盡量採用oracle的序列或sqlserver的identity int,但是遷移完畢後,要注意序列值的更新
系統實現:
1、pl/sql或t-sql,dts、ssis或者powerbuilder的管道作為資料遷移的方式
2、相關業務邏輯的遷移,與資料完整性和業務相關的儲存過程、觸發器、函式的改寫,甚至sql的改寫
3、業務查詢頁面的編寫
後話:1、資料遷移沒有特別或高階的方法
2、對業務資料的分析最為關鍵,需要不斷的嘗試在新系統上不斷的測試
3、資料遷移技術,主要通過sql、儲存過程、甚至游標來實現,優先順序也如上
還有一種資料遷移僅僅是資料庫的平遷或異構資料庫遷移
資料庫平遷,即為了效能擴充套件需要從一台伺服器遷移到另外一台伺服器上,用資料庫的匯出匯入或備份恢復工具處理即可,當然也要考慮遷移後的一些序列欄位的初始值。
異構資料遷移,即從乙個資料庫平台遷移到另外乙個資料庫平台,用etl工具或sql均可實現,不過要注意業務邏輯的遷移,即儲存過程、函式、觸發器之類的
安裝SharePoint的步驟和心得
一 sharepoint介紹 sharepoint分為sharepoint分為兩個部分 sharepoint team services和sharepoint portail servce。sharepoint portal server提供文件管理的核心功能,包括文件管理和發布 索引搜尋服務和儀表...
資料探勘方法和步驟
針對資料探勘過程中直接與資料相關的部分,sas公司提出了semma方 將資料探勘的核心過程分為抽樣 sample 探索 explore 修整 modify 建模 model 評估 assess 幾個階段。1.資料抽樣 資料抽樣就是從資料集中抽取具有代表性的樣本,樣本應該大到不丟失重要的資訊,小到能夠...
關於資料遷移的記錄
前段時間完成了乙個重構專案的數萬資料的遷移 為了提公升系統效能以及業務的合理劃分,從系統a中重構出系統b,資料庫從sql server變為mysql 上線後遇到了一些問題,在此記錄下來提醒自己以後的資料遷移該注意哪些方面。遷移過程中指令碼出現問題 遷移完成後,部分資料是錯的 對於第一點,這裡出現問題...