kaldi中文語音識別 1

2021-09-25 17:05:23 字數 2792 閱讀 2415

本篇部落格主要記錄了我編譯安裝kaldi的過程

另外兩篇部落格的連線

kaldi中文語音識別(2)——用thch30資料集做中文語音識別

kaldi中文語音識別(3)——用cvte模型做中文語音識別

kaldi是乙個用c++寫的語音識別工具包。kaldi旨在供語音識別研究員使用。當然,kaldi也可以用作聲紋識別。關於他的詳細介紹可以訪問kaldi的官方文件

感謝很多大神與科研工作者在kaldi上開源了他們的資料集和訓練模型,讓我這樣的小白可以站在巨人的肩膀上前行。目前我所了解到有3個開源的中文語音識別例子。

清華大學開源的thchs30資料集(瘋狂為cslt打**~~~)

cvte公司開源的cvte mandarin model模型

beijing shell shell technology公司開源的aishell資料集

如果有同學知道其他的資料集or模型,中英文皆可,歡迎聯絡我補充啊~

注意:為了提高訓練的速度,kaldi最好安裝在gpu雲伺服器下。如果沒有伺服器話,使用虛擬機器應該也是可以的,但一定要分配足夠的記憶體空間和儲存空間。下面我就以我使用的centos伺服器為例,介紹kaldi的編譯與安裝。

編譯與安裝大概分為3步

安裝編譯所需依賴包

配置、編譯kaldi

sudo yum install

git -y

git clone

kaldi/

├── copying

├── egs/ //egs目錄裡存放了使用kaldi完成的開源語音識別/聲紋識別專案

├── install //編譯安裝kaldi的指導

├── misc/

├── readme.md

├── scripts/

├── src/ //src資料夾裡存放了kaldi原始碼

├── tools/ //tools資料夾裡存放了語音處理的工具包

└── windows/ //windows資料夾存放了在windows下編譯安裝kaldi的檔案

2.安裝編譯所需要的依賴包編譯之前需要確作業系統中安裝有如下包

subversion

automake

autoconf

libtool

g++zlib

libatal

wget

sox

首先進入到kaldi/tools目錄下,接著在呼叫check_dependencies.sh指令碼檢查系統中的包是否安裝完全

cd kaldi/tools

extras/check_dependencies.sh

如圖所示,這個shell指令碼會提示系統需要安裝的包,按照提示安裝即可。

安裝完成後再次執行這個指令碼,如果提示ok就可以開始進行kaldi的編譯。

3.編譯kaldi

首先編譯tools,在在kaldi/tools目錄下輸入

make

我使用的伺服器是i7有8個核心,因此輸入make -j 8可以使用8個核心一起編譯,加快編譯速度。

之後轉到kaldi/src目錄下,輸入如下命令

cd

../src

在src目錄下首先要執行configure進行配置,由於每個人的cuda版本、安裝路徑不一定相同,所以這裡需要根據自己的伺服器情況進行修改,如下是我的configure配置方案,僅供參考。

./configure --static \

--use-cuda=yes \

--cudatk-dir=/home/zy/cuda/cuda-8.0 \

--mathlib=openblas \

--openblas-root=

../tools/openblas/install \

--threaded-math=no \

--static-math=yes \

--static-fst=yes \

--fst-root=

../tools/openfst

配置完成後,就可以進行src的編譯了

make depend

make

同樣,如果是多核cpu的話,你可以使用make depend -j 8make -j 8加快編譯速度

完成後會有提示成功和失敗,結束make後就算完成了kaldi的編譯與安裝了~

完成kaldi的安裝後,就可以用kaldi做語音識別了~,下面分別是我用kaldi做的兩種不同中文語音識別的部落格連線。

demo(1)——用thch30做中文語音識別

demo(2)——用cvte做中文語音識別

kaldi-ctc的安裝、編譯、測試

語音識別 kaldi 的安裝

本篇部落格主要記錄了我編譯安裝kaldi的過程,算是自己近期學習的乙個總結,也希望可以幫助到需要的人。kaldi是乙個用c 寫的語音識別工具包。kaldi旨在供語音識別研究員使用。當然,kaldi也可以用作聲紋識別。關於他的詳細介紹可以訪問kaldi的官方文件 感謝很多大神與科研工作者在kaldi上...

語音識別工具kaldi在linux環境下的安裝步驟

最近需要進行語音識別的學習,選擇了kaldi作為開發平台,在嘗試了網上的很多安裝方法後,尋找了一種最簡潔的安裝方法,總結如下 第一步 先安裝git 命令 sudo apt get install git 第四步 檢查所需要的包是否安裝完備 命令 cdtools extras check depend...

語音識別工具Kaldi安卓庫編譯

注意 整個配置都在同乙個終端下執行!整個配置都在同乙個終端下執行!整個配置都在同乙個終端下執行!1.android ndk配置 本教程基於 ndk16rb wget q output document android ndk.zip 2 ndk配置 cd opt android ndk r16b b...