本篇部落格主要記錄了我編譯安裝kaldi的過程
另外兩篇部落格的連線
kaldi中文語音識別(2)——用thch30資料集做中文語音識別
kaldi中文語音識別(3)——用cvte模型做中文語音識別
kaldi是乙個用c++寫的語音識別工具包。kaldi旨在供語音識別研究員使用。當然,kaldi也可以用作聲紋識別。關於他的詳細介紹可以訪問kaldi的官方文件
感謝很多大神與科研工作者在kaldi上開源了他們的資料集和訓練模型,讓我這樣的小白可以站在巨人的肩膀上前行。目前我所了解到有3個開源的中文語音識別例子。
清華大學開源的thchs30資料集(瘋狂為cslt打**~~~)
cvte公司開源的cvte mandarin model模型
beijing shell shell technology公司開源的aishell資料集
如果有同學知道其他的資料集or模型,中英文皆可,歡迎聯絡我補充啊~
注意:為了提高訓練的速度,kaldi最好安裝在gpu雲伺服器下。如果沒有伺服器話,使用虛擬機器應該也是可以的,但一定要分配足夠的記憶體空間和儲存空間。下面我就以我使用的centos伺服器為例,介紹kaldi的編譯與安裝。
編譯與安裝大概分為3步
安裝編譯所需依賴包
配置、編譯kaldi
sudo yum install
git -y
git clone
kaldi/
├── copying
├── egs/ //egs目錄裡存放了使用kaldi完成的開源語音識別/聲紋識別專案
├── install //編譯安裝kaldi的指導
├── misc/
├── readme.md
├── scripts/
├── src/ //src資料夾裡存放了kaldi原始碼
├── tools/ //tools資料夾裡存放了語音處理的工具包
└── windows/ //windows資料夾存放了在windows下編譯安裝kaldi的檔案
2.安裝編譯所需要的依賴包編譯之前需要確作業系統中安裝有如下包
subversion
automake
autoconf
libtool
g++zlib
libatal
wget
sox
首先進入到kaldi/tools目錄下,接著在呼叫check_dependencies.sh指令碼檢查系統中的包是否安裝完全
cd kaldi/tools
extras/check_dependencies.sh
如圖所示,這個shell指令碼會提示系統需要安裝的包,按照提示安裝即可。
安裝完成後再次執行這個指令碼,如果提示ok就可以開始進行kaldi的編譯。
3.編譯kaldi
首先編譯tools,在在kaldi/tools目錄下輸入
make
我使用的伺服器是i7有8個核心,因此輸入make -j 8
可以使用8個核心一起編譯,加快編譯速度。
之後轉到kaldi/src目錄下,輸入如下命令
cd
../src
在src目錄下首先要執行configure進行配置,由於每個人的cuda版本、安裝路徑不一定相同,所以這裡需要根據自己的伺服器情況進行修改,如下是我的configure配置方案,僅供參考。
./configure --static \
--use-cuda=yes \
--cudatk-dir=/home/zy/cuda/cuda-8.0 \
--mathlib=openblas \
--openblas-root=
../tools/openblas/install \
--threaded-math=no \
--static-math=yes \
--static-fst=yes \
--fst-root=
../tools/openfst
配置完成後,就可以進行src的編譯了
make depend
make
同樣,如果是多核cpu的話,你可以使用make depend -j 8
和make -j 8
加快編譯速度
完成後會有提示成功和失敗,結束make後就算完成了kaldi的編譯與安裝了~
完成kaldi的安裝後,就可以用kaldi做語音識別了~,下面分別是我用kaldi做的兩種不同中文語音識別的部落格連線。
demo(1)——用thch30做中文語音識別
demo(2)——用cvte做中文語音識別
kaldi-ctc的安裝、編譯、測試
語音識別 kaldi 的安裝
本篇部落格主要記錄了我編譯安裝kaldi的過程,算是自己近期學習的乙個總結,也希望可以幫助到需要的人。kaldi是乙個用c 寫的語音識別工具包。kaldi旨在供語音識別研究員使用。當然,kaldi也可以用作聲紋識別。關於他的詳細介紹可以訪問kaldi的官方文件 感謝很多大神與科研工作者在kaldi上...
語音識別工具kaldi在linux環境下的安裝步驟
最近需要進行語音識別的學習,選擇了kaldi作為開發平台,在嘗試了網上的很多安裝方法後,尋找了一種最簡潔的安裝方法,總結如下 第一步 先安裝git 命令 sudo apt get install git 第四步 檢查所需要的包是否安裝完備 命令 cdtools extras check depend...
語音識別工具Kaldi安卓庫編譯
注意 整個配置都在同乙個終端下執行!整個配置都在同乙個終端下執行!整個配置都在同乙個終端下執行!1.android ndk配置 本教程基於 ndk16rb wget q output document android ndk.zip 2 ndk配置 cd opt android ndk r16b b...