1 什麼是語音:
語音頻號從時域看就是一系列的波形包括振幅和頻率,但語音識別領域一般要從頻域對語音頻號進行分析。因為時域上我們很難找出組成語音的內在規律也就難以進行訊號分析與處理。但頻域上就不同了,我們知道任何複雜的波形都可以有不同頻率的正弦波所組成,而語普就是描述這一特徵的,它包括頻率成分和幅度資訊。
2 語音識別的作用
3 語音識別工具包
htk: (c)
kaldi: (c++, python)
espnet: (pytorch based)
lin**o: (tensorflow based)
4 語音識別資料:
語音識別技術
中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...
語音識別技術
雖然人從外部獲取資訊,絕大部分來自來自視覺,可是語音的地位一直很高的,它很好的表表達了人的特徵和清晰的收入方式。其中語音識別技術的地位又是很高的,可以讓機器在字面上明白你在說什麼,這是自然的人機互動的基礎。現在走在語音識別技術前沿的公司有科大訊飛,google 微軟。在我們的前面幾篇 blog 中已...
語音識別技術概覽
語音識別基本和識別類似,都是從傳統的模型到深度神經網路dnn,再到rnn 深度卷積網路cnn。在端到端方面也是從隱馬爾科夫hmm到ctc lfmmi,再到attention方面 下面是一些模型列表 1.混合高斯 隱馬爾科夫模型 gmm hmm 2.深度神經網路 隱馬爾科夫模型 dnn hmm 3.深...