ok,沉迷了快兩個星期,終於有進展了啊啊啊!!!
這段時間內心崩潰,感覺毫無思路,但是我沒放棄!!!看了許多**,然後**在這個星期也終於調通了。不過還是有很多地方值得優化,後面再繼續努力吧!
其實我個人覺得語音識別這一塊的商用還不夠,情感識別就更別說了,而且識別率這一塊有待提公升。
開始正題
資料集用的是emo-db資料集。並以此充當訓練集,測試集自己想用哪些音訊就可以用哪些音訊,但是命名和檔案路徑得符合**編寫的規則。音訊時長最好不要超過6秒,以便獲得比較好的效能。
一些重要函式:
獲取資料集
**情感函式
訓練模型獲取資料
專案中重要檔案及對應的功能:
audiofeatureextraction.py :音訊特徵提取,從音訊中提取功能
globalvars.py:全域性變數
train.py:訓練模型
predict.py:根據音訊**情感
整個框架採用的是雙lstm+attention機制,attention機制是通過邏輯回歸實現的。
訓練資料
**情感結果
情感分類有以下幾種:生氣,無聊,厭惡,焦慮(害怕),幸福,悲傷,中立。
現在模型的**準確率在百分之六十幾,後面會通過繼續學習來提高精度的。
生命不息,奮鬥不止,fighting!!!
定個小目標:即將擁有腹肌szy!!!
語音情感識別 踩點篇
不管是情感語音識別,還是語音情感識別,含義是一樣的,都是對帶有情感的語音頻號進 感的正確判斷。最傳統的情感語音識別是基於機器學習下的有監督學習完成的。有監督,即 使用訓練集訓練出乙個模型,然後使用該模型對測試集中的語音頻號進 感狀態的正確判斷。傳統的機器學習可以理解為模式識別,即需要通過三個環節來完...
情感語音識別的入門解析
關於情感語音識別領域的研究距今已有二三十餘年的歷史。不管是情感語音識別,還是語音情感識別,含義是一樣的,都是對帶有情感的語音頻號進 感的正確判斷。最傳統的情感語音識別是基於機器學習下的有監督學習完成的。有監督,即 使用訓練集訓練處乙個模型,然後使用該模型對測試集中的語音頻號進 感狀態的正確判斷。傳統...
一些關於語音識別和語音情感識別的資源
這些資源要麼就收費很貴,要麼用不了,嗯 但是也花了很長時間收集,先留著吧。基於svm的語音情感識別 matlab gui介面和文件 點這裡!pythonnlp情感識別專案實戰教程 原始碼 資料集 點這裡!python 語音情感分析 搜一搜?基於svm的情感分析系統點這裡!基於svm的語音情感識別系統...