一種增加先驗知識庫的貝葉斯網路推理模型

2021-09-21 05:55:36 字數 3178 閱讀 2681

瞿錫垚

1 ,劉學軍 1 ,張禮 2

(1.南京航空航天大學,電腦科學與技術學院,江蘇 南京 211106;

2.南京林業大學,資訊科學技術學院,江蘇 南京 210037)

摘 要:貝葉斯網路作為一種不確定知識表示網路,由網路結構和各節點的條件概率表組成,在解決系統決策問

題方面具有先天的理論優勢。目前在大多數貝葉斯網路的應用中,各節點條件概率表的產生均是以人工輸入的方

式完成,這在一些擁有較多網路節點的複雜背景中,需要巨大的人工消耗,效率低下。針對這一問題,提出一種

增加先驗知識庫的貝葉斯網路推理模型。根據具體的建模問題建立先驗知識庫,在該先驗知識庫下對網路節點進

行類別標記,然後根據區域性馬爾科夫性自動生成各節點的條件概率表。在貝葉斯網路推理任務中,使用在精確推

理任務中處理速度快、應用最為廣泛的聯結樹演算法,並使用 hugin 演算法完成訊息的傳遞。最後通過乙個貝葉斯網

絡例項驗證了整個模型的處理流程。

an inference model for bayesian network with prior knowledge base

key words: bayesian network; knowledge base; local markov property; clique tree algorithm; hugin message-passing

algorithm

0 引 言

貝葉斯網路 [1-3] 是一種基於貝葉斯定理的概率圖模型,可表示為

bn =  。網路結構由 表示,是乙個有向無環圖, v是網路節點, e 是節點之間有向邊,

p 指代條件概率表(cpt, conditional probability table)。貝葉斯網路同時具有概率論和圖論的理論基礎,擁有

不確定知識的表示能力。概率推理(probabilistic inference)和最大後驗概率解釋(maximum a

posteriori explanation)是貝葉斯網路推理的兩個基本問題 [4] 。概率推理過程分為精確推理 [5-7] 和近

似推理 [8-9] 兩種,分別適用於網路複雜度低和複雜度高的場景。最大後驗概率解釋則是對建模問

題的計算結果進行解釋性說明與分析。貝葉斯網路在被提出之初,由於其需要大量的計算且被證

明是 np 難問題 [10] ,很長一段時間無法得到廣泛應用。直到計算機的出現,讓貝葉斯網路重新得

到重視,並廣泛應用於故障診斷 [11-12] ,神經網路 [13] 以及作戰重心評估 [14] 等問題。

目前對於貝葉斯網路的應用中,大多是在給定網路結構和條件概率表之後,根據證據節點計

算其他節點的概率值。而網際網路時代帶來了資料量的劇增,導致基於貝葉斯網路的系統決策問題

複雜度提公升,即貝葉斯網路結構中節點數和有效邊數增加。在條件概率表的構造過程中,增加一

個節點會帶來兩種新的狀態,即該節點發生或不發生,而將這兩種新狀態加入到原始網路結構中

時,構造條件概率表的工作量將面臨指數級的增加,這在一定程度上限制了貝葉斯網路的應用範

圍。而在實際應用中,貝葉斯網路節點之間並非都是完全不一致的,一些節點之間具有較高的相

似性。針對網路節點增加帶來的問題以及節點之間相似的應用現實,文中提出並實現了一種增加先

驗知識庫的貝葉斯網路推理模型。根據建模問題相關專家給出的節點類別,以及類別之間的條件

概率,建立先驗知識庫,自動生成貝葉斯網路的條件概率表,使用聯結樹精確推理演算法 [15] 完成

貝葉斯網路的概率推理。

確定貝葉斯網路結構和條件概率表之後,文中使用聯結樹演算法對網路進行精確推理。聯結樹

演算法是目前貝葉斯網路精確推理任務中應用最為廣泛的演算法,可以推理任何網路(單連通或者多

連通),演算法整個過程如圖 2 所示。子網路的提取過程是為了減少運算量,在給定證據之後,可

以刪除與證據無關的節點,即證據的祖先節點中不包含的點。在貝葉斯網路中依次用無向邊連線

每兩個具有共同子節點的節點,然後去除所有貝葉斯網路中有向邊的方向便得到貝葉斯網路的道

德圖。之後使用 kjaerulff 演算法對道德圖進行三角剖分,該演算法具體過程如下:

演算法 1 kjaerulff 演算法

輸入:貝葉斯網路道德圖;

輸出:原道德圖中所有完全子圖。

演算法 2    建立 clique 聯結樹演算法

輸入:clique 集合與分割集集合;

輸出:clique 聯結樹。

演算法 3  hugin 演算法

輸入:clique 聯結樹,證據節點ve 以及條件概率表;

輸出:貝葉斯網路中所有節點對於證據節點的後驗概率。

參考文獻

學習知識的一種思路

昨天看到王垠博士的思維導圖,裡面有個很重要的概念就是學習知識分類,然後不斷的細化下去。聽說寫作也是一樣,作家也是先寫好提綱,然後一點點填充內容。看到這個讓我想起了禪與電單車裡作者對科學,對文學的學習方法,其實就是分類,然後再對子節點進行分類。其實大多數人都是在做別人早都研究出來的東西,用生活大 裡的...

閱讀《你的知識需要管理》一書之建立你的知識庫

你的知識需要管理 這本是技巧類的書,主要是教你怎樣去學習知識,儲存知識,共享知識,使用知識和創新知識。其中一些觀點很新穎,我也覺得很受用。我先把我做的思維導圖放出來。在這本書裡,我最為深刻和受用的是以下幾個關於知識管理的建議 我自己總結之 1 很多知識你只需要知道怎樣找到即可,無需記住 2 建立你的...

一種基於多源資料的知識融合方法

摘要 本發明提出了一種基於多源資料的知識融合方法,在融合多個 的實體資料時,首先分別對每個資料來源的屬性進行規範化表示,其中包括了同義屬性對映和對屬性值的數值單位的統一轉換,這樣對屬性的規範化處理可以減少對後續實體比較造成的影響 然後基於實體名和實體屬性對實體進行分塊聚合,這樣僅將同一分塊內不同 的...