語音識別 MLLT

2021-08-20 12:42:23 字數 2405 閱讀 1654

i=

axiyi=axi

,然後在新的特徵空間進行建模、匹配,同樣得到乙個新的似然度pypy

。由於似然度分別在兩個不同空間計算,所以不能直接相比,解決的辦法有兩個,乙個是限制|a|

=1|a|=1

,另乙個辦法就是將似然度變換回原空間的尺度:p(x

n1,x

,x)=

py(y

n1,y

y)∗∏

mi=1

|a|n

ip(x1n,x,x)=py(y1n,yy)∗∏i=1m|a|ni

。這裡,採用第乙個限制來敘述,即採取限制|a|

=1|a|=1。=

a(n,

d)ex

p(−1

2n[(

μ¯¯¯

−μ)t

σ−1(

μ¯¯¯

−μ)+

tr(σ

−1σ¯

¯¯¯)

+log

|σ|]

)(1)

(1)p=a(n,d)exp(−12n[(μ¯−μ)tς−1(μ¯−μ)+tr(σ−1σ¯)+log|σ|])(n

,d)=

(2π)

−nd2

a(n,d)=(2π)−nd2

。在ml準則下,估計出來的模型引數μμ和σ

σ的估計值μˆμ^

和σˆσ^分別等於訓練資料的樣本均值μ¯¯

¯μ¯和樣本協方差σ¯¯

¯¯σ¯,代入等式(1)中得到 ∗(

xn1)

=g(n

,d)|

σ¯¯¯

¯|−n

2(2)

(2)p∗(x1n)=g(n,d)|σ¯|−n2(n

,d)=

(2πe

)−nd

2g(n,d)=(2πe)−nd2¯¯

¯¯σ¯i

=axi

yi=axi

,可以求出μ¯¯

¯y=a

μ¯¯¯

μ¯y=aμ¯和σ¯

¯¯¯y

=aς¯

¯¯¯a

tσ¯y=aσ¯at

。可以計算出其似然值 ∗(

xn1)

=g(n

,d)|

aς¯¯

¯¯at

|−n2

=|a|

−np∗

(xn1

)(3)

(3)p∗(x1n)=g(n,d)|aσ¯at|−n2=|a|−np∗(x1n)a|

=1|a|=1

,所以,做了線性變換之後,似然度並沒有變化,從ml的角度來說,模型並沒有被優化。 

但是在實際應用中的高斯模型是受限的,即樣本協方差矩陣被對角化了。也就是說ml的模型引數μμ和σ

σ的估計值為μˆ=

μ¯¯¯

μ^=μ¯和σˆ

=dia

g(σ¯

¯¯¯)

σ^=diag(σ¯)

。那麼,式(3)的ml值就變成 ∗d

iag(

xn1)

=g(n

,d)|

diag

(σ¯¯

¯¯)|

−n2(4)

(4)pdiag∗(x1n)=g(n,d)|diag(σ¯)|−n2di

ag(σ

¯¯¯¯

)|≥|

σ¯¯¯

¯||diag(σ¯)|≥|σ¯|∗(

xn1)

≥p∗d

iag(

xn1)

p∗(x1n)≥pdiag∗(x1n)∗d

iag(

yn1)

=g(n

,d)|

diag

(σ¯¯

¯¯)|

−n2pdiag∗(y1n)=g(n,d)|diag(σ¯)|−n2

,可見,與式子(4)不同了,如果變換陣a能夠使得樣本協方差矩陣σ¯¯

¯¯σ¯盡可能對角化,減少取對角的損失,就可以使得p∗(

xn1)

≥p∗d

iag(

xn1)

p∗(x1n)≥pdiag∗(x1n)

。比如,a為樣本協方差矩陣σ¯¯

¯¯σ¯的pca變換陣,那麼由於aς¯

¯¯¯a

t=λaσ¯at=λ,λλ

是由σ¯¯¯

¯σ¯的特徵值組成的對角陣,而且|λ|

=|σ¯

¯¯¯|

|λ|=|σ¯|

,所以此時, ∗d

iag(

yn1)

=p∗(

xn1)

≥p∗d

iag(

xn1)

(5)(5)pdiag∗(y1n)=p∗(x1n)≥pdiag∗(x1n)

C 語音識別(文字to語音 語音to文字)

最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...

C 語音識別(文字to語音 語音to文字)

最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...

語音識別技術

中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...