自動問答技術簡介

瀏覽:1081次

出處資訊

引言圖 1 siri(左)和watson(右)

傳統的自動問答系統包括三個主要部分：問題分析、資訊檢索和答案抽取。結構關係如下：

圖 2 傳統的自動問答系統的組成部分

答案抽取是從檢索得到的相關文件中抽取答案。根據問題型別的不同，答案形式也不盡相同，可能是乙個詞語、乙個句子，也可能是乙個段落或者更長的文字串。以抽取句子作為答案為例，按照一定的策略(如計算問句與候選答案的相似度)計算句子的權重，根據權重大小對句子進行排序得到候選答案列表，並根據問題型別或者其他選取策略篩選獲得最終答案。

且看自動問答系統如何回答「姚明的身高是多少」和「水煮牛肉的做法」，回答靠譜吧？

圖 4 自動問答系統的回答例項

圖 5 自動問答系統的回答例項

問題分析模組對使用者的提問進行分析，確定問題的語義型別，**答案的型別，例如答案是回答人物、時間、地點或者還是回答人物的年齡、商品的**等；判斷使用者的提問是否為確定性問題，對於有明確具體答案的確定性問題，分析問題的結構並直接定位使用者的所求。

答案抽取模組從知識庫中檢索問題的答案並返回給使用者。對於確定性問題，根據問題的要點直接檢索ontology並返回答案；對於非確定性問題或者未找到答案的確定性問題，通過檢索優質問答資源獲取答案，即計算使用者的提問與優質問答資源中的問題的相似度，獲取相同問題或同義問題，直接返回滿足提問的答案。

可以看出，影響自動問答的準確率主要有兩個方面，一是知識庫的容量是否足夠大，儲存的資源是否準確可靠；二是非確定性問題或者未找到答案的確定性問題，檢索結果是否與原問題一致。

通過多重策略可以保證知識庫資源的準確。首先，選擇可靠的知識站點和其他web站點進行知識挖掘；第二，利用冗餘資訊對挖掘得到的資源進行驗證；第三，利用多種策略對挖掘結果進行過濾。另外，定期和不定期地對知識庫的內容進行更新，增加新的資源並濾除其中雜質。正所謂，「問渠那得清如許，為有源頭活水來」。

保證檢索結果與使用者的提問相一致依賴於乙個秘密**，「語義相似度計算」，這裡不再贅述，有興趣的且聽下回分解。

1) 快速響應

2) 較高準確率

3) 開放的回答領域

4) 質量不斷提公升

知識庫中的資源的數量在持續增加，質量也在不斷提公升。知識庫的更新方式包括定期手動新增資源以及實時自動挖掘資源，用更合適的問答資源替換現有的部分。因此，問答的準確率和召回率會逐步遞增。

by zou hongjian, hu dawei, fang gaolin

自動問答技術簡介

技術問答 16

能夠把自動問答機制應用到運維中嗎

關於Oracle的技術問答

自動問答技術簡介

技術問答 16

能夠把自動問答機制應用到運維中嗎

關於Oracle的技術問答

相關推薦