語音識別標準中WER和SER解釋

在語音識別中，常用的評估標準為詞錯誤率wer，

wer計算方式為：為了使識別出來的詞序列和標準的詞序列之間保持一致，需要進行替換，刪除，或者插入某些詞，

這些插入，替換，刪除的詞的總個數，除以標準的詞序列中詞的個數的百分比，即為wer，其計算公式如下所示：

需要注意的是，因為有插入詞，所以wer有可能大於100%，

例子：如下圖所示：

第一行為標準的詞序列，第二行為識別出來的詞序列

那麼上述的wer計算如下所示：

增加詞3個，替換的詞6個，刪除的詞1個，那麼wer為：

在語音識別中，除了wer，還有句子識別錯誤率這個標準，即ser，ser表述為句子中如果有乙個詞識別錯誤，那麼這個句子被認為識別錯誤，句子識別錯誤的的個數，除以總的句子個數即為ser

其計算公式如下所示：

除了wer，ser，還有字錯誤率，即cer，不是很常用就不介紹了。

頂

語音識別評估標準 WER

在語音識別中，常用的評估標準為詞錯誤率wer，wer計算方式為為了使識別出來的詞序列和標準的詞序列之間保持一致，需要進行替換，刪除，或者插入某些詞，這些插入，替換，刪除的詞的總個數，除以標準的詞序列中詞的個數的百分比，即為wer，其計算公式如下所示需要注意的是，因為有插入詞，所以wer有可能大於...

語音識別中的詞錯率（SER）以及字錯率（WER）

句錯率 sentenct error rate，ser 如果識別的句子與標準句子中由任意乙個字不對應，那麼這句話就是錯的，錯的句子個數除以總句子個數即為句錯率。公式如下可以理解為以下情況描述例子由於字多而導致句子不對如吃了嗎？識別為吃了嗎媽？由於字少而導致句子不對如吃了嗎？識別為吃...

語音識別中的聲學模型（AM）和語言模型 LM

本文主要受參考自以及最近看essen原始碼，感覺對於asr 的一下之前的比較基礎的演算法很生疏，在知乎上看到這個鏈結，感覺講的比較通俗易懂，拿來再理解一下。decoder是根據字典，聲學模型和語音模型，將輸入的語音特徵失量序列轉化為字串行。聲學模型是對聲學語音學環境的變數說話人性別口音等...

語音識別標準中WER和SER解釋

語音識別評估標準 WER

語音識別中的詞錯率（SER）以及字錯率（WER）

語音識別中的聲學模型（AM）和語言模型 LM

相關推薦