本人從研究生開始學習語音頻訊號處理到工作中實際的工程實踐
,至今已經七年多了,這跟
」七年之癢
」真的沒有關係
,主要是一方面最近比較空閒
,有時間做些總結和規劃
,另一方面也是為準備從事這個職業或者正在從事這個職業的新手們提供一點參考
,當然一家之言,,
尤其希望那些資深人士不吝指點.
1、涉及的方向 1
)語音、音訊編譯碼演算法
已經成熟地商業化、產品化,壓縮位元速率和音質總是一對冤家,只有一些特殊的儲存和通訊應用會要求低位元速率,更多的是追求高品質的音質,例如高畫質音質。 2
)語音識別演算法
做過一年半,初步了解識別率受多種因素影響,技術本身還需要在抗干擾等方面進一步發展,目前只有一些特殊場合的應用產品化,作為人機互動的大規模應用還有一段路要走。 3
)語音合成演算法
4)語音增強演算法
這個沒有接觸核心技術,感覺回聲消除、降噪處理等還是很有用處。 5
)語音頻號分析
主要一些特殊應用需求,如智慧型玩具、軍工等。 6
)音訊特徵提取和檢索
**哼唱和**檢索,以及音訊的特殊應用。 7
)音效處理演算法 在
***上非常普遍的音效處理演算法,當然也有立體聲環繞和多聲道處理演算法。 2
、涉及的行業 1
)嵌入式、積體電路、晶元 .
2)計算機軟硬體
這個行業裡,可以做標準演算法的研發,也可以做應用程式,或者是第三方軟體開發。 3
)通訊行業
這個行業應該不多,一般音訊編譯碼屬於信源編碼,而通訊行業涉及的技術比較多,從天線的傳送接收,基帶晶元的解碼,語音編譯碼,上下通道的控制等系統。 3
、涉及的職業 1
)做標準、第三方演算法研發
做音訊演算法的國際標準,如
itu g.7xx
、寬頻語音編碼,或者第三方語音演算法的研發,如語音識別、語音合成等。往往這樣的職位需要碩士以上學歷,對數字訊號處理理論要求較高。 2
)做移植、優化
在晶元公司為產品做音訊演算法的移植和優化,需要對晶元指令和演算法本身有較強的理解。做嵌入式產品,就意味著在低成本、低功耗、資源少的情況下要具有足夠的耐心去一點點優化演算法,我曾經對
amr-nb
中的碼書搜尋部分、
lsf向量量化部分進行至少
5遍的**優化,漸漸將所用的指令數減到最小化。每一遍過後都覺得沒有再優化的地方了,然後靜下心再分析演算法原理、分析**執行和指令特點,就有了新的發現。以至於後來流傳著「優化無極限」,當然優化工作很可能是用較少的時間就優化了總量的
80%,但剩下的
20%需要付出更多的時間,全憑專案的需求來權衡了,積累一定的經驗很重要。 3
)做產品應用
做一般多**軟體的應用開發,涉及語音頻本身的理論較少,更多的是計算機技術。 4
、優缺點
做語音頻演算法職業的缺點是」少
」, 相關的公司少,專業對口的職業少,做這個職業的人也少
,發展機會少一點,當然這個「少」也是不同時期,不同職業之間的相對比較而言的。優點自然是競爭壓力相對小些,工作相對穩定。
5、三點總結
我一路走來,犯了許多錯誤,但是塞翁失馬,焉知非福? 1)
雜而不專
「專」是指專注在乙個方向上的技術和業務積累。
window
程式,明天去焊焊電路。典型的學的雜,但是哪個都淺嘗輒止,最後想想哪個都拿不出手,感覺就是樣樣行,樣樣都很膚淺。 2)
專而不精
「精」是指在乙個方向上達到精通的水平(技術方面)和高效的業務能力(專案管理方面)。
工作了一段時間,比較清楚自己的興趣和特長,於是靜下心盡量把範圍縮小,主要集中在語音頻編譯碼上,但是有時還要根據實際專案需求去做其它方向的。另外,如果專案時程緊張的話,技術方面如果不經過深加工,積累的經驗還是很少。我目前正處於這個階段,需要堅實的理論基礎以便深入演算法(演算法層面)和不斷的總結專案經驗教訓(工程實現方面)來提高自己。 3)
精而不廣
「廣」是指見識要廣,具有行業思維、市場化的眼光。
身處在這個賴以謀生的行業,自然要關心一下它的動態發展,我們在技術上要深挖一口井,但眼界上卻不要做乙個井底之蛙!
最後,談一下工作態度,我自認為資質平庸,還是踏踏實實做事,認認真真做人。不要盲目和別人攀比,產生不良的心態,影響日常的工作和生活。對於那些比我強的人,我是這樣看的:客觀上,他們一定有我們不具有的能力,這裡的能力是指綜合評價得到的,包括智商(學習能力、技術深度廣度、創新思維等)、情商(人脈關係、成長環境、習慣等);主觀上,每個人都有自己的人生軌跡,苦辣酸甜只有自己知道,平衡好自己生活的各個方面才是最好的。
演算法工程師的職業規劃
參考鏈結1 程式設計師的三個發展分支 資深技術工程師,對於技術比較痴迷,有這方面的鑽勁。以後可以去做技術顧問,可能一周只去公司兩天,但是拿的工資是非常高的。2.管理 有長時間的工作經驗,在公司可以帶別人去成長,目前常見的三個管理職業,專案經理 產品經理,技術總監。做管理需要高情商,維護人事關係,有自...
音訊演算法工程師招聘之困
清明回杭。還是家裡的床舒服,家裡的飯菜可口,杭州的生活安逸。這幾天一方面總結正弦模型的 和發展,一方面思考公司音訊團隊的建設。在天堂軟體園的spr咖啡內安逸的享受著陽光,寫下下面有感而發的話。但是現狀是音訊演算法工程師是很難找的。我想這裡有如下幾個原因 1.面向應用的,國內對音訊演算法應用 消費類 ...
聊聊工程師的職業素養
公司是零售電商企業,最近為了應對雙十一以及和阿里合作帶來的巨大導流,要對相關的系統做一些列的效能測試。幸福來得太突然,留給測試和效能調優的時間不多,故最近加班蠻多的。時間緊迫,相對應的測試 現了很多不可預知的事情,說說其中發生的一些事,以及引起今晚想寫這篇部落格的原因吧,純屬吐槽和個人想法,看看就行...