MCMC 關鍵概念理解

2021-09-13 13:44:24 字數 3429 閱讀 2981

回顧如下公式,既然對於α(i

,j

)\alpha(i,j)

α(i,j)

我們將之理解為從一條馬氏鏈過渡到另一條馬氏鏈的跳轉率(也作接受率),並且實際操作中是通過物理過程:從均勻分布中抽樣這個動作來實現的。那麼式中的q(i

,j

)q(i,j)

q(i,j)

,作為轉移矩陣中的乙個點,它也是乙個取值於(0,1)的概率值,它的作用形式是怎樣的?

p (i

)q(i

,j)α

(i,j

)=p(

j)q(

j,i)

α(j,

i)

p(i)q(i,j)\alpha(i,j)=p(j)q(j,i)\alpha(j,i)

p(i)q(

i,j)

α(i,

j)=p

(j)q

(j,i

)α(j

,i)回顧實際取樣過程:

其中b-1步中獲得的樣本y

yy是從條件分布q(x

∣xt)

q(x|x_t)

q(x∣xt

​)中隨機抽樣的。因此實現q(i

,j

)q(i,j)

q(i,j)

發生作用的物理過程就是在這一步中所進行的隨機抽樣。

為什麼在解讀α(i

,j

)\alpha(i, j)

α(i,j)

的時候要把它理解為乙個物理過程?

這實際上是要理解概率之於樣本或者抽樣過程的關係。

由於抽樣過程的結果是實實在在的樣本,它並不是乙個概率值,例如:

如何理解拒絕跳轉這一現象?我們知道如果發生一次拒絕跳轉,就把上一次抽樣結果當做本次抽樣結果放到抽樣鏈裡去。相當於該樣本重複了一次,那麼在最後得到的樣本中是否要去除這些重複的樣本(或者說只取連續遊程中的第乙個)?

假設狀態集合為s=[

s1,s

2,s3

]s=[s_1, s_2, s_3]

s=[s1​

,s2​

,s3​

],滿足細緻平穩條件的q

′q\prime

q′的矩陣結構如下式所示,可知由於乘以α(i

,j

)\alpha(i,j)

α(i,j)

而丟失的概率質量全部轉移到了對角線上,相當於放大了狀態轉移到自己的概率。而這會降低馬氏鏈收斂到穩態的速度。

q ′=

q⋅a=

q\prime=q\cdot a= \\ \left\ 1-\sum_^3 p(1,j)\alpha(1,j) & p(1,2)\alpha(1,2) & p(1,3)\alpha(1,3) \\ p(2,1)\alpha(2,1) & 1-\sum_^3 p(2,j)\alpha(2,j) & p(2,3)\alpha(2,3) \\ p(3,1)\alpha(3,1) & p(3,2)\alpha(3,2) & 1-\sum_^3 p(3,j)\alpha(3,j) \end \right\}

q′=q⋅a

=⎩⎪⎨

⎪⎧​1

−∑j=

13​p

(1,j

)α(1

,j)p

(2,1

)α(2

,1)p

(3,1

)α(3

,1)​

p(1,

2)α(

1,2)

1−∑j

=13​

p(2,

j)α(

2,j)

p(3,

2)α(

3,2)

​p(1

,3)α

(1,3

)p(2

,3)α

(2,3

)1−∑

j=13

​p(3

,j)α

(3,j

)​⎭⎪

⎬⎪⎫​

假設t-1步鏈上的樣本為s(t

−1)=

s1

s^=s_1

s(t−1)

=s1​

,同時t步已抽取樣本st=

s2

s^t=s_2

st=s2​

,則此時q′∣

st=s

2q\prime|s^t=s_2

q′∣st=

s2​具有如下形式,由下式可知這就是跳轉的真實過程。

q ′∣

(s(t

−1)=

s1,s

t=s2

)=(q

⋅a)∣

(s(t

−1)=

s1,s

t=s2

)q\prime|(s^ = s_1,s^t=s_2)=(q\cdot a)|(s^ = s_1,s^t=s_2)

q′∣(s(

t−1)

=s1​

,st=

s2​)

=(q⋅

a)∣(

s(t−

1)=s

1​,s

t=s2

​)=

= \left\ (1-\sum_^3 p(1,j)\alpha(1,j))|_t & (p(1,2)\alpha(1,2))|_t & (p(1,3)\alpha(1,3))|_t \\ \dots & \dots & \dots \\ \dots & \dots & \dots \end \right\} \\

=⎩⎨⎧​(

1−∑j

=13​

p(1,

j)α(

1,j)

)∣t​

……​(

p(1,

2)α(

1,2)

)∣t​

……​(

p(1,

3)α(

1,3)

)∣t​

……​⎭

⎬⎫​

=

=\left\ 1-p(1,2)\alpha(1,2) & p(1,2)\alpha(1,2) & 0 \\ \dots & \dots & \dots \\ \dots & \dots & \dots \end \right\}

=⎩⎨⎧​1

−p(1

,2)α

(1,2

)……​

p(1,

2)α(

1,2)

……​0

……​⎭

⎬⎫​如何確定burn-in過程的長度,即:該捨棄多少次抽樣?

視問題複雜度,由於α(i

,j

)\alpha(i,j)

α(i,j)

的存在延長了抽樣過程中馬氏鏈收斂到穩態時間。

關鍵概念理解 未完待續

預設情況下,每個主分片都有乙個副本,但可以在現有索引上動態更改副本數。永遠不會在與其主分片相同的節點上啟動副本分片。分片分布計算公式 shard num hash routing num primary shards routing是文件的 id 寫入到elasticsearch的文件,在預設的情況...

Libra協議 關鍵概念

libra區塊鏈是乙個加密認證的分布式賬本,它主要基於libra協議。libra區塊鏈由分布式網路中的驗證者節點維護。驗證者通過共識協議來維護區塊鏈上的交易達成一致。libra測試網就是libra core的原型的示例。libra協議的核心有兩個概念,分別是交易和狀態。在任何時刻,區塊鏈都有乙個 狀...

理解記憶體概念

儘管記憶體這個詞常常掛在我們的嘴上,但是,有多少人真正了解記憶體 理解記憶體概念呢?對剛剛步入電腦世界的初學者來說,基本記憶體 上位記憶體 高階記憶體 擴充套件記憶體 擴充記憶體 保留記憶體等概念更是玄之又玄,難以徹底理解。所以我們特地介紹一下記憶體的基本概念。基本知識 記憶體 記憶體就是儲存程式以...