傅利葉變換:
python numpy.linspace實用方法
結合,matplotlib庫pyplot的基本使用
numpy.random.rand()
梅爾頻率倒譜係數(mfcc)教程
隱馬爾科夫模型(hidden markov models,hmms)
python_argparse.argumentparser()
librosa語音頻號處理
短時傅利葉變換原理解
給子圖新增colorbar(顏色條或漸變色條)
sklearn.preprocessing.scale
語音識別中的決策樹
1.為什麼需要決策樹 我們在使用htk進行語音識別模型訓練的過程中,首先進行的是單音素 單個高斯的模型訓練。拋開單個高斯不說,單音素模型本身有很大缺點 沒有考慮到本音素前後音素的發音對本音素的影響。比如,同樣是乙個音素iy,如果它前面的音素分別是h和p,那麼iy這個音素在這兩種情況下的發音會有所不同...
雜訊抑制在遠場語音識別和通話中的應用
對帶噪語音做雜訊抑制,在遠場語音識別和通話中都會用到,也都會碰到乙個矛盾,是盡量的消除雜訊即便對語音有損傷,還是盡量的不損傷語音即便保留一些雜訊呢?筆者這些年,接觸了不少語音識別行業和通話行業的人,大家都在說,我們是兩個行業,雖然雜訊抑制的原理差不多,但是乙個是給機器聽的,乙個是個人聽的。那麼具體有...
語音中的關於語音識別的一些知識
以下內容都是抄的,哈哈哈 1.mel頻率 是模擬人耳對不同頻率語音的感知。人類對不同頻率語音有不同的感知能力 對1khz以下,與頻率成線性關係,對1khz以上,與頻率成對數關係。頻率越高,感知能力就越差了。因此,在應用中常常只使用低頻mfcc,而丟棄中高頻mfcc。在mel頻域內,人對音調的感知能力...