語音識別技術原理

2021-10-25 07:30:59 字數 984 閱讀 5025

語音識別技術原理

語音識別系統提示客戶在新的場合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統也不會被錄音欺騙。文字相關的聲音識別方法可以分為動態時間伸縮或隱馬爾可夫模型方法。文字無關聲音識別已經被研究很長時間了,不一致環境造成的效能下降是應用中的乙個很大的障礙。

其工作原理:

動態時間伸縮方法使用瞬間的、變動倒頻。2023年bogertetal出版了《回聲的時序倒頻分析》。通過交換字母順序,他們用乙個含義廣泛的詞彙定義了乙個新的訊號處理技術,倒頻譜的計算通常使用快速傅利葉變換。

從2023年起,隱馬爾可夫模型變得很流行。運用隱馬爾可夫模型的方法,頻譜特徵的統計變差得以測量。文字無關語音識別方法的例子有平均頻譜法、向量量化法和多變數自回歸法。

平均頻譜法使用有利的倒頻距離,語音頻譜中的音位影響被平均頻譜去除。使用向量量化法,語者的一套短期訓練的特徵向量可以直接用來描繪語者的本質特徵。但是,當訓練向量的數量很大時,這種直接的描繪是不切實際的,因為儲存和計算的量變得離奇的大。所以嘗試用向量量化法去尋找有效的方法來壓縮訓練資料。montacieetal在倒頻向量的時序中應用多變數自回歸模式來確定語者特徵,取得了很好的效果。

想騙過語音識別系統要有高質量的錄音機,那不是很容易買到的。一般的錄音機不能記錄聲音的完整頻譜,錄音系統的質量損失也必須是非常低的。對於大多數的語音識別系統,模仿的聲音都不會成功。用語音識別來辨認身份是非常複雜的,所以語音識別系統會結合個人身份號碼識別或晶元卡。

語音識別系統得益於廉價的硬體裝置,大多數的計算機都有音效卡和麥克風,也很容易使用。但語音識別還是有一些缺點的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由於傷風、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統比指紋識別系統有著較高的誤識率,因為人們的聲音不像指紋那樣獨特和唯一。對快速傅利葉變換計算來說,系統需要協同處理器和比指紋系統更多的效能。目前語音識別系統不適合移動應用或以電池為電源的系統。

語音識別技術

中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...

語音識別技術

雖然人從外部獲取資訊,絕大部分來自來自視覺,可是語音的地位一直很高的,它很好的表表達了人的特徵和清晰的收入方式。其中語音識別技術的地位又是很高的,可以讓機器在字面上明白你在說什麼,這是自然的人機互動的基礎。現在走在語音識別技術前沿的公司有科大訊飛,google 微軟。在我們的前面幾篇 blog 中已...

語音識別技術概覽

語音識別基本和識別類似,都是從傳統的模型到深度神經網路dnn,再到rnn 深度卷積網路cnn。在端到端方面也是從隱馬爾科夫hmm到ctc lfmmi,再到attention方面 下面是一些模型列表 1.混合高斯 隱馬爾科夫模型 gmm hmm 2.深度神經網路 隱馬爾科夫模型 dnn hmm 3.深...