(y
−xw)
t(y−
xw)∂
w∂(y−xw)t(y−xw)∂wy、
wy、w
為列向量,x
x為矩陣(w
)∗v(
w)u(w)∗v(w)
的形式,這種形式一般求導較為複雜,因此為了簡化運算,我們先把式子展開成下面的樣子(注意:(xw
)t=w
txt(xw)t=wtxt
): (yt
y−yt
xw−w
txty
+wtx
txw)
∂w∂(yty−ytxw−wtxty+wtxtxw)∂wyt
y∂w−
∂ytx
w∂w−
∂wtx
ty∂w
+∂wt
xtxw
∂w∂yty∂w−∂ytxw∂w−∂wtxty∂w+∂wtxtxw∂wyt
y∂w∂yty∂w
求導 : ∂yt
y∂w=
0∂yty∂w=00。
ytxw
∂w∂ytxw∂w
求導 : ∂yt
xw∂w
=xty
∂ytxw∂w=xtyty
xty 。wt
xty∂
w∂wtxty∂w
求導 : ∂wt
xty∂
w=∂(
wtxt
y)t∂
w=∂y
txw∂
w=xt
y∂wtxty∂w=∂(wtxty)t∂w=∂ytxw∂w=xtywt
xtxw
∂w∂wtxtxw∂w
求導 : ∂wt
xtxw
∂w=2
xtxw
∂wtxtxw∂w=2xtxwtx
xtx)為對稱矩陣當做**中的a
a ,所以得到求導結果 2xt
xw2xtxw
。
矩陣求導公式 預備知識 矩陣求導
在優化中,面對的大都是多變數問題。針對多變數問題,為了表示公式和編寫 的方便,往往都用矩陣表示。而優化中,求導往往又是家常便飯,因此對於矩陣求導需要有熟練地掌握,不然很多時候會對一些演算法十分頭暈,編寫程式時也會不知所措。因為我就是這麼暈過來的 捂臉 好了,現在開始步入正文 1.矩陣對標量求導 如果...
矩陣(向量)求導
在網上看到有人貼了如下求導公式 y a x dy dx a y x a dy dx a y a x b dy dx a b y a x b dy dx b a 1.矩陣y對標量x求導 相當於每個元素求導數後轉置一下,注意m n矩陣求導後變成n m了 y y ij dy dx dy ji dx 2.標...
矩陣求導公式
基本公式 y a x dy dx a y x a dy dx a y a x b dy dx a b y a x b dy dx b a 1.矩陣y對標量x求導 相當於每個元素求導數後轉置一下,注意m n矩陣求導後變成n m了 y y ij dy dx dy ji dx 2.標量y對列向量x求導 注...