玻爾茲曼機

2021-10-07 07:16:52 字數 1382 閱讀 6011

我將嘗試介紹有關受限玻爾茲曼機器的直覺及其工作方式。

什麼是玻爾茲曼機?

玻爾茲曼機器是能夠學習內部表示的隨機生成的神經網路,能夠表示和(給定足夠的時間)解決困難的組合問題。

玻爾茲曼機如何工作?

玻爾茲曼機如下所示:

boltzmann機是僅有兩種型別的節點(隱藏節點和可見節點)的非確定性(或隨機)生成型深度學習模型。

沒有輸出節點!這似乎很奇怪,但這就是賦予他們這種不確定性的原因。它們沒有典型的1或0型別輸出,可使用隨機梯度下降來學習和優化模式以進行輸出。他們沒有這種能力學習模式,這就是他們如此特別的原因!

這裡要注意的乙個區別是,與其他傳統網路(a / c / r)的輸入節點之間沒有任何連線的不同,玻爾茲曼機在輸入節點之間具有連線。從圖中可以看出,所有節點都連線到所有其他節點,而不管它們是輸入節點還是隱藏節點。這使他們可以在彼此之間共享資訊並自行生成後續資料。我們僅衡量可見節點上的內容,而不衡量隱藏節點上的內容。提供輸入後,他們就可以捕獲資料中的所有引數,模式和相關性。這就是為什麼它們被稱為深度生成模型並且屬於無監督深度學習類的原因。

什麼是受限玻爾茲曼機?

rbm是具有生成功能的兩層人工神經網路。他們有能力學習其輸入集上的概率分布。 rbm由geoffrey hinton發明,可用於降維,分類,回歸,協作過濾,特徵學習和主題建模。

rbm是boltzmann機器的特殊類別,它們在可見單元和隱藏單元之間的連線方面受到限制。與boltzmann機器相比,這使實現它們變得容易。如前所述,它們是兩層神經網路(一層是可見層,另一層是隱藏層),這兩層通過完全二部圖相連。這意味著可見層中的每個節點都連線到隱藏層中的每個節點,但是同一組中沒有兩個節點相互連線。這種限制允許使用比一般boltzmann機器更有效的訓練演算法,特別是基於梯度的對比發散演算法。

受限的玻爾茲曼機看起來像這樣:

如果您想知道s型函式是什麼,可以使用以下公式:

其中h(1)和v(0)是隱藏層和可見層的對應向量(列矩陣),其中上標為迭代(v(0)表示我們提供給網路的輸入),而a是 隱藏層偏差向量。

現在,此影象顯示了反相或重建階段。 它與第一遍相似,但方向相反。 公式得出是:

其中v(1)和h(1)是可見層和隱藏層的對應向量(列矩陣),其中上標為迭代,b是可見層偏差向量。

玻爾茲曼機

結構 兩層的神經網路 可視層與隱藏層 雙向全連線 即可視層作為輸入用於啟用隱藏層單元,隱藏層作為輸入用於啟用可視層單元 輸入資訊重構 目的 輸入向量v 與輸出向量 h 隱藏層的輸出 盡可能一一對應。即 h進可能是 v的編碼。只有h與 v一一對應,重構資訊才能與v與 v 誤差盡可能小。構造乙個 v,h...

玻爾茲曼機

受限玻爾茲曼機 rbm 是一種用於降維 分類 回歸 特徵學習 協同濾波 主題建模的演算法。注釋 1.在機器學習和統計學習領域,降維是指在某些特定條件下,降低隨機變數的個數,得到一組不相關主變數的過程。降維可分為特徵選擇和特徵提取兩大方法 特徵選擇假定資料中包含大量冗餘或者無關變數 或稱特徵 屬性 指...

受限玻爾茲曼機二

限制波爾茲曼機rbm使用方法 限制波爾茲曼機rbm能量模型 從能量模型到概率 求解極大似然 用到的抽樣方法 馬爾科夫蒙特卡羅簡介 參考文獻 利用上面的公式得到的是某個單元狀態為1的輸出概率。那麼怎樣才能確定這個單元的狀態是1呢?它通過產生乙個0 1的隨機,如果這個隨機數小於上面得到的概率值,這個單元...