i=
axiyi=axi
,然後在新的特徵空間進行建模、匹配,同樣得到乙個新的似然度pypy
。由於似然度分別在兩個不同空間計算,所以不能直接相比,解決的辦法有兩個,乙個是限制|a|
=1|a|=1
,另乙個辦法就是將似然度變換回原空間的尺度:p(x
n1,x
,x)=
py(y
n1,y
y)∗∏
mi=1
|a|n
ip(x1n,x,x)=py(y1n,yy)∗∏i=1m|a|ni
。這裡,採用第乙個限制來敘述,即採取限制|a|
=1|a|=1。=
a(n,
d)ex
p(−1
2n[(
μ¯¯¯
−μ)t
σ−1(
μ¯¯¯
−μ)+
tr(σ
−1σ¯
¯¯¯)
+log
|σ|]
)(1)
(1)p=a(n,d)exp(−12n[(μ¯−μ)tς−1(μ¯−μ)+tr(σ−1σ¯)+log|σ|])(n
,d)=
(2π)
−nd2
a(n,d)=(2π)−nd2
。在ml準則下,估計出來的模型引數μμ和σ
σ的估計值μˆμ^
和σˆσ^分別等於訓練資料的樣本均值μ¯¯
¯μ¯和樣本協方差σ¯¯
¯¯σ¯,代入等式(1)中得到 ∗(
xn1)
=g(n
,d)|
σ¯¯¯
¯|−n
2(2)
(2)p∗(x1n)=g(n,d)|σ¯|−n2(n
,d)=
(2πe
)−nd
2g(n,d)=(2πe)−nd2¯¯
¯¯σ¯i
=axi
yi=axi
,可以求出μ¯¯
¯y=a
μ¯¯¯
μ¯y=aμ¯和σ¯
¯¯¯y
=aς¯
¯¯¯a
tσ¯y=aσ¯at
。可以計算出其似然值 ∗(
xn1)
=g(n
,d)|
aς¯¯
¯¯at
|−n2
=|a|
−np∗
(xn1
)(3)
(3)p∗(x1n)=g(n,d)|aσ¯at|−n2=|a|−np∗(x1n)a|
=1|a|=1
,所以,做了線性變換之後,似然度並沒有變化,從ml的角度來說,模型並沒有被優化。
但是在實際應用中的高斯模型是受限的,即樣本協方差矩陣被對角化了。也就是說ml的模型引數μμ和σ
σ的估計值為μˆ=
μ¯¯¯
μ^=μ¯和σˆ
=dia
g(σ¯
¯¯¯)
σ^=diag(σ¯)
。那麼,式(3)的ml值就變成 ∗d
iag(
xn1)
=g(n
,d)|
diag
(σ¯¯
¯¯)|
−n2(4)
(4)pdiag∗(x1n)=g(n,d)|diag(σ¯)|−n2di
ag(σ
¯¯¯¯
)|≥|
σ¯¯¯
¯||diag(σ¯)|≥|σ¯|∗(
xn1)
≥p∗d
iag(
xn1)
p∗(x1n)≥pdiag∗(x1n)∗d
iag(
yn1)
=g(n
,d)|
diag
(σ¯¯
¯¯)|
−n2pdiag∗(y1n)=g(n,d)|diag(σ¯)|−n2
,可見,與式子(4)不同了,如果變換陣a能夠使得樣本協方差矩陣σ¯¯
¯¯σ¯盡可能對角化,減少取對角的損失,就可以使得p∗(
xn1)
≥p∗d
iag(
xn1)
p∗(x1n)≥pdiag∗(x1n)
。比如,a為樣本協方差矩陣σ¯¯
¯¯σ¯的pca變換陣,那麼由於aς¯
¯¯¯a
t=λaσ¯at=λ,λλ
是由σ¯¯¯
¯σ¯的特徵值組成的對角陣,而且|λ|
=|σ¯
¯¯¯|
|λ|=|σ¯|
,所以此時, ∗d
iag(
yn1)
=p∗(
xn1)
≥p∗d
iag(
xn1)
(5)(5)pdiag∗(y1n)=p∗(x1n)≥pdiag∗(x1n)
C 語音識別(文字to語音 語音to文字)
最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...
C 語音識別(文字to語音 語音to文字)
最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...
語音識別技術
中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...