特定人語音喚醒簡介

1. 什麼是特定人語音喚醒

人的語音中含有大量的資訊，除了語音內容(說了什麼)外，還有語種(中文、英語)、身份(張

三、李四)、情緒(平靜、開心)等資訊。

特定人語音喚醒，就是通過識別語音中所含的內容和人的身份資訊，來實現特定人語音喚醒功能。這是一種較為新穎、具有一定安全性、便捷性和趣味性的功能，同時可以增強個性化體驗。在yunos語音助手中，就應用了此功能。此時機主可以通過「你好小雲」這個語音口令，解鎖手機並且喚醒yunos語音助手。

和常見的語音喚醒相比，特定人語音喚醒功能不僅要求說對喚醒口令、還會判斷是誰在說出這個口令。一旦口令不對或者身份不對，則會拒絕解鎖手機和喚醒yunos語音助手。

2. 特定人語音喚醒的基本框架

特定人語音喚醒方案整體框圖如下：

語音喚醒使用之前需要乙個初始設定，特定人語音喚醒也一樣，這是讓智慧型裝置認識使用者自己聲音的過程，初始設定在這裡稱之為「註冊

」，對應於模式識別的訓練過程。預設情況下，使用者根據頁面提示，說出三遍

「你好小雲

」就可以完成初始設定。註冊完了之後，使用者就可以使用特定人語音喚醒了。使用時，只有預設的語音口令內容、說話人身份都匹配的時候，手機才能解鎖或者開啟特定程式。

3. 分層次gmm(higmm)模型

除了vad(

靜音檢測

)、特徵提取、評分等模組之外，模型是是整個方案中的關鍵。為了實現同時完成語音喚醒和特定人判別，我們設計了乙個分層次

gmm(higmm)

方案。模型訓練如下圖所示。

其中，需要完成的步驟有：

1. 訓練乙個和說話人無關、內容無關的全域性

gmm模型；

2. 根據註冊資料，訓練乙個特定人、和內容無關的

gmm模型；這一步的

gmm模型，可以根據最大後驗準則，用全域性

gmm和訓練資料獲得；

3. 根據註冊資料，訓練一系列的特定人、特定內容的

gmms

。這個過程中，首先需要把整個句子合理地切分成幾個語音段，對於每個語音段，根據2的

gmm，訓練乙個

gmm。由於每乙個語音段都表示了特定說話內容因此訓練得到的

gmm，代表了特定人、特定文字內容；

gmm序列組合起來，則代表了特定人、特定口令內容。

4. 特定人語音喚醒應用

目前雲手機上，yunos語音助手整合了特定人聲紋喚醒功能，使用者可以通過「你好小雲」喚醒yunos語音助手。

yunos語音助手聲紋功能還可以「被鍛鍊」，隨著喚醒次數增多，可以使yunos語音助手更熟悉使用者的聲音，並且減少他人的聲音或者雜訊帶來的誤操作。

基於DTW自學習的非特定人語音識別

最近需要在cortexm4是做一套非特定人孤立詞識別演算法，研究了一下語音識別演算法，目前較為廣泛的是dtw hmm和ann，由於mcu算力有限，演算法較為簡單的dtw顯然是不二之選。dtw dynamic timewarping 演算法是一種模式匹配經典演算法，它使用動態規劃 dp 的方法成功解決...

基於ARM的非特定人語音識別系統設計

隨著高新技術在軍事領域的廣泛運用，裝備逐步向高精尖方向發展。傳統的軍事訓練由於訓練時間長訓練費用高訓練空間窄，常常不能達到預期的訓練效果，已不能滿足現代軍事訓練的需要。為解決上述問題，模擬訓練應運而生。為進一步提高訓練效果，本文利用智慧型語音互動晶元設計了某模擬訓練器的示教與回放系統。示教系...

特定人語音喚醒簡介

基於DTW自學習的非特定人語音識別

基於ARM的非特定人語音識別系統設計

基於LD3320的非特定人語音識別方案

相關推薦