由於工作的原因,很長時間不能更新部落格和管理kaldi群,每天看著kaldi群的人數不斷增長,由衷的為從事語音感到自豪,希望在我部落格和群裡能得到你們想要的,但我同時拒絕伸手黨。這幾年語音的發展很迅速,所以導致更多的人來學習:
下面主要從2個方面來說明,乙個是從學生角度,乙個是從工業角度。希望以後問怎麼學習和怎麼研究的人會越來越少,當然我這裡也只是拋磚引玉。
如果你是本科生,你或許付出的努力會更多。如果你是研究生,最好是數學和英語好,要不然你同樣付出很多努力。
1、基礎部分
預設你是研究生,你學過基本的矩陣理論和隨機過程,一些簡單的模式識別原理,這樣你或者利於理解識別的原理。預設你能夠閱讀一般的英文文獻,不要害怕專有名詞,等你見多了,自然能看懂。也行英文六級過了,一般的文章能看得懂,只要語句知道怎麼翻譯。這就是數學和英文基礎,希望你具備。
此外,預設你具有一些計算機基礎,比如c語言和c++,和其他的一些指令碼語言如python,shell,perl等基礎。如果你不會的話,不要怕,去網上聽公開課,也許你聽的夠多,也就會了。此外,你一定要會linux的基本命令,僅僅是基本命令,慢慢的你也會其他高階的命令,這個只要你慢慢用。
如果你不具備這些,可以早點學;如果你具備,那你已經達到基礎的一步。如果你覺得特別難,趕緊放棄吧。其他的路也是一條很好的路,其實學語音識別需要的東西太多,所以你要有足夠的思想準備。如果你的老師或者其他人只丟給你乙個課題,如果你根本不感冒,那就勸你直接放棄吧。也許你學習其他的東西,也可以活得很好。再次強調,這也許是一條不歸路,或者說很長很長的路,遠比你之前遇到的都難。
接下來你需要看一些語音的基礎知識,知道語音的一些基本處理或者訊號的一些基本處理。如果你根本不懂傅利葉變換或者你根本不知道為什麼那樣,或許你需要思考。這個是大學的訊號與系統,數字訊號處理,通訊原理等等的一些基礎知識。
3.高階
你可以去看看kaldi的指令碼和**或者htk的指令碼和**或者其他平台,再根據你的理論試試結合,如果你不懂,多問問,也許你慢慢就積累了,慢慢就會了。如果有人帶你,那就更好了。慢慢的你就成為高手了。
這時候你理解了gmm-hmm那套後,就去看dnn那一套吧,甚至更高深的東西。
如果你是學生,發現上面跟你的差別特別大,如果你沒興趣的話,最好放棄,別為難自己。要學的的確很多,但為了你未來的路好走,或許你必須這樣辛苦。
如果你只是想使用語音識別,你最好去調別人家的sdk。如果你的確需要去做,你可以看看上面的那麼多條,你具備嗎?
其次,你真的很想很想做,第乙個問題來,語料有嗎?買,的確很貴,不買,做不出來。然後,你有人嗎?沒有幾個懂得人慢慢去弄也很麻煩,所以的確不是剛需,你可以嘗試去調別人的sdk。
經常會被問的問題:
1.我就想做個我說一句話,然後就識別為文字。
有時候問這個問題,我的確挺氣的。你們知道這背後有多少東西,沒有那麼簡單就搞出來的。統一回答:你需要找到訓練語料,然後訓練乙個模型,然後再弄解碼,然後再出來。這個需要訓練模型,需要語料,你有嗎?
2.不是有kaldi或者htk了嗎?再說王東老師都開源中文的識別例子了?自己可以搞了。
然而並不是,王東老師弄這個例子是為了促進中文語音識別的發展,真的特別感謝王東老師。我當時讀研的時候什麼資料庫都沒,就自己看。但這個語料僅僅只是科研,你想要工業應用,還差十萬八千里。開源的的確存在,你需要有自己的資料庫,然後利用開源來搭建乙個適合自己情景的系統。
3.機器真的要gpu嗎?
現在都知道dnn或者lstm的效果好,這些都是用顯示卡和語料燒出來的,也就是用錢喂出來的。所以這個的確需要錢……
基本對於工業的人來說已經夠了,應該足夠自己做判斷了。再次強調語音識別還是乙個高門檻的事情,謹慎入。當然土豪就無所謂了。
以上對於大家來說,可以做判斷了,聰明的人做聰明的判斷。
希望更多的人加入到語音這個大家庭來,共同繁榮語音事業。
後續會根據反饋情況,逐步反饋。
2.自己的資料怎麼弄?
kaldi中有很多的例子,你可以參考kaldi裡的任何乙個例子,英文的可以參考的很多,中文的就參考王東老師提供的thchus30。主要是資料準備階段,其他的都可以復用指令碼,但不一定適合自己,別忘了調整引數。
原鏈結。
新手入門Opencv的建議
先來一段百科的官方原話 opencv是乙個基於bsd許可 開源 發行的跨平台計算機視覺庫,可以執行在linux windows android和mac os作業系統上。它輕量級而且高效 由一系列 c 函式和少量 c 類 構成,同時提供了python ruby matlab等語言的介面,實現了 影象處...
LAMMPS安裝 給新手的建議
給初學者安裝lammps軟體的建議 2 安裝時開始記得make no all進行安裝,如果生成可執行檔案說明安裝正確 3 到lammps官網,檢視每個包的功能,然後安裝一些自己需要的包,不要所有包都裝上,這樣執行時會變慢 4 有些包需要先在 lib下安裝支援包,否則通不過 5 安裝時,根據自己的平台...
站長經驗 從新手四問談給新手的建議
大家好,我是虛子雨。在寫過這麼多文章以來,有非常多的人加我,很多人都是抱著和我交流的目的來加我,非常感謝這些朋友對我的支援。和這些朋友們接觸多了,我很快就發現他們的問題很多都很類似,今天特意整理了四個常見的問題,給大家乙個最實在的答案,也順便提提對新手的一些建議。1 怎樣建站?不怕告訴大家,我不會建...