元資料管理的五種成熟度
當企業內外部的資料越來越多時,元資料管理就會成為許多公司的乙個關鍵問題。本文從使用者、處理和技術的不同角度,描述企業元資料管理的不同成熟度模型和企業沿著成熟度階梯向上提公升的步驟。
對於什麼是元資料,目前存在著許多種不同的描述。本文中的元資料報括技術上的元資料和業務上的元資料。技術上的元資料指資料來源的位置、資料訪問協議(odbc、jdbc、sql*net等)、資料來源的物理結構(如資料庫描述、表定義、欄目描述等)、資料來源的邏輯結構(er模型、目標模型、實體模型)等。業務上的元資料指與資訊獲取有關的上下文資訊、定義企業組織機構和產品層級的分類法、用來定義商業術語的控制性詞彙的詞彙表或參考資料,例如醫學詞典、金融術語等。
所謂元資料管理,就是對技術元資料和業務元資料進行管理,其目標是為了提公升共享、重新獲取和理解企業資訊資產的水平。不對元資料進行管理或管理不得當,資訊將被丟失或處於隱匿狀態而難以被使用者使用,資料整合將十分昂貴,不能對業務進行有效支撐。終端使用者要識別相關的資訊將十分困難,終端使用者將失去對資料的信任。本文描述了元資料管理的五級成熟度模型。各個公司可以依據本公司人們怎樣處理元資料的行為特徵,利用它作為指導,決定公司目前所處的級別。
第一級: 隨機狀態(ad-hoc)
行為特徵 在這一級上,對元資料的管理是隨機的。元資料由某個人或某一組人員在區域性產生或獲取,並在區域性使用。在大多數時間裡,元資料是隱匿在資訊中,比如儲存於諸如word、excel等形式的辦公文件,這些文件使用的術語僅區域性的使用者能知道其確切含義。人們通過與「責任人」直接通訊或通過資訊會話來獲取這些知識。在區域性環境工作數月或數年後,人們使這些元資料以及對它的理解內在化,使對這種資訊有習慣性的理解。
在這一階段,元資料通過組織機構緩慢的傳播或根本不傳播,這取決於區域性小組與其他小組間的通訊量的大小,這些元資料可能永遠「待」在該區域性小組或某個人那兒。如果這樣的小組或個人調離,則這種元資料資訊可能永遠丟失。
人 元資料知識保留在人的大腦中。在這種環境中,知道(或不知道)與誰交談對於理解元資料成為一件十分重要的事。
處理 元資料要通過與「責任人」的交談才能共享。新來者需要通過他們的日常工作來學習元資料。外部人員難以理解元資料,他們必須與「責任人」交談才能得到他們想要的東西。因為元資料在區域性產生或抓取並在區域性使用,所以通常也只能在區域性修改,這種修改通常也不會通知公司裡其他的組織。
技術 可以用各種不同的工具來生成元資料。絕大部分是面向個人電腦的應用軟體。例如,erwin可用於資料庫建模,rational用於為物件建模、excel用於生成商品列表等。這些工具都沒有設計成可以交換資訊,因此,只能在當地的檔案系統中儲存所生成的元資料。
第二級: 發現
行為特徵 在元資料管理的這一級上,可以發現在不同企業之間的元資料。像第一級的情況一樣,元資料仍然在區域性產生和抓取,然而,它處於可發現狀態,這樣的元資料在企業一級顯露,使得每乙個對它有興趣的人都能隨時了解「什麼已經存在」。元資料仍然可以在區域性級上維護,然後更新**知識庫,但它們仍然使用不同的命名法。結果,相同的名字被用於表示意義不同的事情,而同一件事情則使用了幾個不同的名字。
人 人們開始感知到共享元資料資訊的重要性。業務分析員、資料擁有者和應用開發者現在自覺地將元資料資訊載入到**知識庫中。
處理 元資料知識經由**資料庫進行共享。憑藉對**知識庫地理解,人們能夠發現在其他應用系統中的資料。然而,由於使用術語的不同,人們互相之間需要交流,以便弄清某些元資料的含義。而且,由於元資料的更新不受任何方式的控制,使得這種更新沒有告示或貼切的分析。
技術 有一些元資料管理工具可用於共享來自資料來源的元資料,並能把來自不同建模工具的邏輯元資料匯入到元資料知識庫中。ag rochade、unicon、metamatrix是該類產品的一些例子。然而,除了以商業含義來定義資料**的欄目名之外,這些工具沒有乙個能很好地抓取元資料。
第**: 管理控制
行為特徵 這一級對元資料的修改進行集中管理。區域性業務單元或開發小組如不通知其他的元資料保管者和使用者,就不再能按照自己的想法對元資料進行修改。在乙個地方發起的元資料的修改將傳播給其他地方。有各種工具和方法可用於不同業務單元之間交換元資料。為了整合不同資料來源中的資料,仍然必須用手工進行資料的對映,以解決不同資料來源的資料整合。但是,這種對映在乙個**知識庫上進行維護和管理。
人 資料擁有者、應用開發人員、使用者和其他的資料儲存者現在比以往任何時候更清楚元資料管理的重要性。人們遵循有關元資料管理的「監督」處理操作規程。在對元資料進行修改前,他們就分析這種修改將會產生的影響。他們認識到元資料的共享將使組織的運作更有效,並使他們的生活更輕鬆。
處理 建立了監督體系結構(誰是資料和應用的擁有者),監督資產(資料倉儲、資料集市、命名標準)和流程(何時開始更新、如何更新)。
技術 有幾個工具經常被用於元資料的監督處理。schemalogic是一種新興的工具,通常被用於幫助監督處理發現業務的詞彙及其分類。還有一些軟體提供商正在相互競爭,以填補這一空間,但還沒有一家能提供商用的產品。
第四級: 優化
行為特徵 在對元資料實施集中儲存並通過監督體制對元資料進行管理後,企業會發現,通過標準化和整合可以實施有意義的優化。為了優化各業務單元之間的各種衝突和各個副本,人們開發了乙個企業資料模型和詞彙表。人們可以將這些標準模型和詞彙表用於各種新的應用。時機成熟時,可以把各種老的應用遷移到這些模型上。
人 在這一級,人們堅持不懈地探索優化的途徑。人們協同工作,通過在資料的入口點確認資料的有效性來提高資料的質量。通過確定各業務實體的權威資料來源,使資料的對映達到最小化。資料開始從乙個業務單元平滑地流到另乙個業務單元,而不用擔心昂貴的資料整合成本。
處理 首先,生成企業資料模型,並在**知識庫進行維護。第二,對資料模型中定義的每乙個實體確定權威資料來源或企業應用的主參照資料,然後將業務的上下文資訊和含義與這些資料來源進行關聯。在整個組織中對業務的詞彙表進行標準化。鼓勵應用開發小組使用這些標準化的術語,來生成、傳播和表示資訊。
技術 目前,僅有少數幾個能幫助企業實施優化的工具。而且,每乙個工具只能完成其中一到兩個任務,還沒有哪個工具能做企業優化所需的所有事情。
第五級: 自動化
行為特徵 在這一級,元資料管理是自動進行的。當在邏輯層次發生元資料更新時,它們將被傳播到物理層次。反之,當在物理層次發生更新時,邏輯層次將被更新,以反映這種更新。在元資料中的任何變化也將觸發業務工作流,以處理其他各個業務系統所需的相對應的任何修改。由於各個應用系統遵照相同的詞彙表,它們之間的關係可以通過知識本體進行推斷,所以,各應用系統之間資料格式的對映自動產生。
人 人們把元資料管理作為常規業務的組成部分。就像電信網對業務的支援一樣,元資料成為組織運作中一種關鍵的、普遍存在的、無形的資產。元資料管理變成業務處理的乙個主要組成部分,而且,整個業務運作都要依賴於它。事實上,如果元資料管理實施得很好,人們可以無需關心它在何處。在自動化級,元資料管理成為一種使能器,而不被視為一種障礙。
處理 在這一級,元資料管理的處理較為理想。絕大多數處理是自動完成的。人們從手工和程式處理過程中解放出來。他們在元資料判定上可以工作得更有效。當業務變化時,由知識工人對企業資料模型、詞彙表和知識本體進行維護。這樣一種改變立即會在各個應用中反映出來。例如,假如乙個新產品被引進,把它加到企業詞彙表和知識本體中,這一情況將自動地被傳播給金融系統、製造業系統和營銷系統。使得每個應用系統無需花費昂貴的代價,去完成相應的修改。
技術 各個應用必須使用企業資料模型、詞彙表和知識本體來獲取、傳播和表示資料。人們開發了各種**,將資料從一種格式翻譯成另一種格式。為了實現這些功能,當前正在展開知識庫表示和知識整合方面的許多研究。
需求 需求管理成熟度的五個級別
的一樣,我們都不可能一下子就精通,而是按照一種學習的曲線進展,本篇本篇主要介紹一下需求管理成熟度的六個級別。沒有任何明確的需求被記錄下來,他們假定知道要構建什麼,希望節省需求的時間來做開發,但這勢必會給開發工作帶來混亂,因為需求是一項比較複雜的工程,並不能通過假定就可以明確軟體功能,這樣做很可能會導...
需求 需求管理成熟度的五個級別
的一樣,我們都不可能一下子就精通,而是按照一種學習的曲線進展,本篇本篇主要介紹一下需求管理成熟度的六個級別。沒有任何明確的需求被記錄下來,他們假定知道要構建什麼,希望節省需求的時間來做開發,但這勢必會給開發工作帶來混亂,因為需求是一項比較複雜的工程,並不能通過假定就可以明確軟體功能,這樣做很可能會導...
需求 需求管理成熟度的五個級別
的一樣,我們都不可能一下子就精通,而是按照一種學習的曲線進展,本篇本篇主要介紹一下需求管理成熟度的六個級別。沒有任何明確的需求被記錄下來,他們假定知道要構建什麼,希望節省需求的時間來做開發,但這勢必會給開發工作帶來混亂,因為需求是一項比較複雜的工程,並不能通過假定就可以明確軟體功能,這樣做很可能會導...