在語音識別中遇到的函式 記錄08 10

2021-10-08 20:06:35 字數 504 閱讀 1540

傅利葉變換:

python numpy.linspace實用方法

結合,matplotlib庫pyplot的基本使用

numpy.random.rand()

梅爾頻率倒譜係數(mfcc)教程

隱馬爾科夫模型(hidden markov models,hmms)

python_argparse.argumentparser()

librosa語音頻號處理

短時傅利葉變換原理解

給子圖新增colorbar(顏色條或漸變色條)

sklearn.preprocessing.scale

語音識別中的決策樹

1.為什麼需要決策樹 我們在使用htk進行語音識別模型訓練的過程中,首先進行的是單音素 單個高斯的模型訓練。拋開單個高斯不說,單音素模型本身有很大缺點 沒有考慮到本音素前後音素的發音對本音素的影響。比如,同樣是乙個音素iy,如果它前面的音素分別是h和p,那麼iy這個音素在這兩種情況下的發音會有所不同...

雜訊抑制在遠場語音識別和通話中的應用

對帶噪語音做雜訊抑制,在遠場語音識別和通話中都會用到,也都會碰到乙個矛盾,是盡量的消除雜訊即便對語音有損傷,還是盡量的不損傷語音即便保留一些雜訊呢?筆者這些年,接觸了不少語音識別行業和通話行業的人,大家都在說,我們是兩個行業,雖然雜訊抑制的原理差不多,但是乙個是給機器聽的,乙個是個人聽的。那麼具體有...

語音中的關於語音識別的一些知識

以下內容都是抄的,哈哈哈 1.mel頻率 是模擬人耳對不同頻率語音的感知。人類對不同頻率語音有不同的感知能力 對1khz以下,與頻率成線性關係,對1khz以上,與頻率成對數關係。頻率越高,感知能力就越差了。因此,在應用中常常只使用低頻mfcc,而丟棄中高頻mfcc。在mel頻域內,人對音調的感知能力...