瀏覽:1081次
出處資訊
引言圖 1 siri(左)和watson(右)
傳統的自動問答系統包括三個主要部分:問題分析、資訊檢索和答案抽取。結構關係如下:
圖 2 傳統的自動問答系統的組成部分
答案抽取是從檢索得到的相關文件中抽取答案。根據問題型別的不同,答案形式也不盡相同,可能是乙個詞語、乙個句子,也可能是乙個段落或者更長的文字串。以抽取句子作為答案為例,按照一定的策略(如計算問句與候選答案的相似度)計算句子的權重,根據權重大小對句子進行排序得到候選答案列表,並根據問題型別或者其他選取策略篩選獲得最終答案。
且看自動問答系統如何回答「姚明的身高是多少」和「水煮牛肉的做法」,回答靠譜吧?
圖 4 自動問答系統的回答例項
圖 5 自動問答系統的回答例項
問題分析模組對使用者的提問進行分析,確定問題的語義型別,**答案的型別,例如答案是回答人物、時間、地點或者還是回答人物的年齡、商品的**等;判斷使用者的提問是否為確定性問題,對於有明確具體答案的確定性問題,分析問題的結構並直接定位使用者的所求。
答案抽取模組從知識庫中檢索問題的答案並返回給使用者。對於確定性問題,根據問題的要點直接檢索ontology並返回答案;對於非確定性問題或者未找到答案的確定性問題,通過檢索優質問答資源獲取答案,即計算使用者的提問與優質問答資源中的問題的相似度,獲取相同問題或同義問題,直接返回滿足提問的答案。
可以看出,影響自動問答的準確率主要有兩個方面,一是知識庫的容量是否足夠大,儲存的資源是否準確可靠;二是非確定性問題或者未找到答案的確定性問題,檢索結果是否與原問題一致。
通過多重策略可以保證知識庫資源的準確。首先,選擇可靠的知識站點和其他web站點進行知識挖掘;第二,利用冗餘資訊對挖掘得到的資源進行驗證;第三,利用多種策略對挖掘結果進行過濾。另外,定期和不定期地對知識庫的內容進行更新,增加新的資源並濾除其中雜質。正所謂,「問渠那得清如許,為有源頭活水來」。
保證檢索結果與使用者的提問相一致依賴於乙個秘密**,「語義相似度計算」,這裡不再贅述,有興趣的且聽下回分解。
1) 快速響應
2) 較高準確率
3) 開放的回答領域
4) 質量不斷提公升
知識庫中的資源的數量在持續增加,質量也在不斷提公升。知識庫的更新方式包括定期手動新增資源以及實時自動挖掘資源,用更合適的問答資源替換現有的部分。因此,問答的準確率和召回率會逐步遞增。
by zou hongjian, hu dawei, fang gaolin
技術問答 16
可參考 comparableclassfor returns x s class if it is of the form class c implements comparable else null.如果繼承comparable 就返回他的class 如果不是就返回null 這個方法在puttr...
能夠把自動問答機制應用到運維中嗎
大體的流程 相關的說明 db 儲存需求人員的各種需求及相應的處理辦法 接收服務端傳送的查詢請求後,返回相應的結果。服務端 接受需求人員的請求,然後查詢資料庫去查詢處理方法,得到結果後把其傳送到相關伺服器去處理,並接受結果返回給使用者 如果資料庫中沒有相關記錄就把資訊 給運維人員。需求人員 向服務端提...
關於Oracle的技術問答
關於oracle的技術問答 今天和oracle的乙個資深前輩聊了下,聊了不少技術的問題,他也來了興致,隨機提了幾個問題來問我,發現看似簡單的問題還是有不少的乾貨,很多東西似懂非懂其實還是沒有深入理解,限於篇幅,整理了一部分的問題,有些問題回答的對,但是感覺理解還是不夠清晰深入。log buffer ...