第二章p37
公式(2.52)及(2.53)
引數w
\boldsymbol w
w的後驗分布為
p (w
∣x,y
;ν,σ
)=p(
w,y∣
x;ν,
σ)∑w
p(w,
y∣x;
ν,σ)
(2.52)=
p(y∣
x,w;
ν,σ)
p(w;
ν)p(
y∣x;
ν,σ)
∝p(y
∣x,w
;ν,σ
)p(w
;ν)(
2.53
)\begin p(\boldsymbol w|\boldsymbol x,\boldsymbol y;\nu,\sigma) &=\fracp(\boldsymbol w,\boldsymbol y|\boldsymbol x;\nu,\sigma)} &(2.52) \\ &= \frac \\ &\propto p(\boldsymbol y|\boldsymbol x,\boldsymbol w;\nu,\sigma)p(\boldsymbol w;\nu) &(2.53) \end
p(w∣x,
y;ν,
σ)=
∑wp
(w,y
∣x;ν
,σ)p
(w,y
∣x;ν
,σ)
=p(y
∣x;ν
,σ)p
(y∣x
,w;ν
,σ)p
(w;ν
)∝p
(y∣x
,w;ν
,σ)p
(w;ν
)(2
.52)
(2.5
3)其中p(y
∣x,w
;ν,σ
)p(\boldsymbol y|\boldsymbol x,\boldsymbol w;\nu,\sigma)
p(y∣x,
w;ν,
σ)//(在非似然解釋下 此概率為x,w
\boldsymbol x,\boldsymbol w
x,w兩事件條件下y
\boldsymbol y
y的概率)
為w
\boldsymbol w
w的似然函式(在y
\boldsymbol y
y已知的條件下不同引數w
\boldsymbol w
w對其分布的影響)
p (w
,y∣x
;ν,σ
)p(\boldsymbol w,\boldsymbol y|\boldsymbol x;\nu,\sigma)
p(w,y∣
x;ν,
σ)解釋為x
\boldsymbol x
x事件下w,y
\boldsymbol w,\boldsymbol y
w,y同時發生的概率
θ ∗,
θ′∗=
arg minθ
,θ′1
n∑ni
=1l(
x(i)
,x′(
i))=
arg minθ
,θ′1
n∑ni
=1l(
x(i)
,gθ′
(fθ(
xi))
)\begin \theta ^,\theta ^&= \argmin\limits_}\frac\sum_^l\left (\textbf^,\textbf^ \right )\\ &=\argmin\limits_}\frac\sum_^l\left (\textbf^,g_}\left ( f_\left ( \textbf^\right )\right )\right ) \end
θ∗,θ′∗
=θ,
θ′ar
gmin
n1
∑ni=
1l(
x(i)
,x′(
i))=
θ,θ′
argm
inn
1∑n
i=1
l(x(
i),g
θ′(
fθ(
xi))
)lstm講解
understanding lstm networks很好的講明了理論內容
lstm細節分析理解(pytorch版)大概講解了lstm和pytorch結合的內容
mysql運維 讀書筆記 Mysql 讀書筆記
mysql儲存時間有兩種型別 datetime和timestamp。分別說一下兩者的區別。datetime,以8位元組儲存時間,理論上可以從0000年儲存到9999年。並且沒有時區的概念,它儲存的就是乙個時間點的概念。timestamp和datetime最主要的不同就是,它是以4個位元組儲存,由19...
struts in action讀書筆記
struts in action 學習筆記 一 struts的控制流 因為web 應用是動態的,所以很難表現 乙個真正固定的控制流 取決於環境,不同的方式下有很多不同的事情發生 特別是在web 應用中。但是事情仍然有乙個通用的秩序。如果你是個struts,應用框架,甚至web 應用的新手,這些流程剛...
中 斷(讀書筆記)
裝置的中斷會打斷核心中程序的正常排程和執行,系統對更高吞吐率的追求勢必要求中斷服務程式盡可能地短小精悍。但是這個良好的願望往往與現實並不吻合。在大多數的系統中,當中斷到來時,要完成的工作往往並不是短小的,它可能要求進行較大量的耗時處理。為了在中斷執行時間盡可能短和中斷處理需要完成大量工作之前找乙個平...