kaldi不是一款語音識別系統,而是一款建立語音識別系統的系統。
kaldi是乙個開源的語音識別工具,整合了htk的基本功能,同時也加入了深度神經網路的分類器(dnn)。可實現與文字無關的lvcsr系統,基於fst的訓練與解碼,支援多種標準的機器學習訓練模型。
kaldi相關文件可參考官網:
kaldi核心採用c++語言編寫,易於修改和擴充套件。有如下重要特點:
ø 有限狀態轉換器(fsts)的code-level整合;
ø 廣泛的線性代數支援,矩陣函式庫中包含標準blas和lapack運算;
ø 可擴充套件性設計,演算法採用最通用形式;
ø 開源,apache2.0許可,支援修改和重新發布;
ø 包含語音識別系統搭建的完整框架,從ldc等資料庫可以直接工作。
需要明確的是kaldi的目標受眾是專業的語音識別研究人員或有一定基礎的自學者。短期內,kaldi的文件中不會出現像htk那麼多關於統計語音識別的介紹性資料。
kaldi的其他特點:
ø 強調通用演算法和通用框架;
ø 演算法正確性,不會出現突發性fail;
ø **完全測試過;
ø 保持功能簡單,每個命令列實現有限的功能;
ø **易於理解;
ø **易於復用和重構。
由於centos 上沒有git需要安裝git工具 使用 yum 進行安裝yum install -y git
安裝好git後執行下面的命令 我是放到 /opt 下面了 然後執行以下命令
git clone kaldi-trunk --origin golden
「trunk」標識的版本是最新的版本並且容易安裝,通常也比較好。最新的例項放在的」egs/rm/s5」目錄下而不是s3目錄。
切換到toos目錄
cd kaldi-trunk/tools/
檢查依賴的軟體 執行此命令可以檢查在安裝kaldi 之前系統缺少什麼依賴 根據提示進行安裝 ,特別是再安裝python3的時候不要安裝最新版 本人親自嘗試了安裝的3.7.1的python版本不行 安裝3.6.3的版本可以
在進行安裝依賴的時候python3 放到最後安裝 不能使用yum 安裝 安裝流程如下
extras/check_dependencies.sh
根據指示安裝缺失的包,直到看到:extras/check_dependencies.sh: all ok.切換到opt目錄下 使用命令
cd /opt/
wget ""
tar -zxvf python-3.6.3.tgzcd python-3.6.3
mkdir /usr/local/python3
./configure --prefix=/usr/local/python3
make
make install
cd /usr/bin/
ln -s /usr/local/python3/bin/python3 /usr/bin/python3
再tools目錄下輸入make進行安裝:輸了make命令 如果電腦是多核的 可以輸入 make -j n 其中 n 帶邊cpu核數
make -j 4
完成之後切換到src目錄:
cd ../src
./configure
make -j 4
如果沒有出錯 則安裝成功
安裝python3不要太新 一定放到所有依賴安裝完成後最後安裝python3 安裝好後python2 和python3可以並存
centos7安裝mysql教程(親測)
centos7安裝最新版的mysql 5.7 注意 下面的安裝步驟是在伺服器上沒有安裝第三方發布的rpm包情況下。uname a el is short for red hat enterprise linux el el6 is the download for red hat 6.x,cento...
centOS7環境下kaldi安裝步驟
cd kaldi tools,執行它檢視缺少哪些底層依賴 extras check dependencies.sh 按指示安裝依賴 yum install gcc c make automake autoconf patch bzip2 unzip wget sox gcc gfortran lib...
centos7安裝MongoDB3 4(親測有效)
簡介 mongodb 是乙個介於關聯式資料庫和非關聯式資料庫之間的產品,是非關聯式資料庫當中功能最豐富,最像關聯式資料庫的。他支援的資料結構非常鬆散,是類似json的bson格式,因此可以儲存比較複雜的資料型別。mongo最大的特點是他支援的查詢語言非常強大,其語法有點類似於物件導向的查詢語言,幾乎...