對話系統綜述

2021-08-19 08:41:40 字數 1172 閱讀 9633

the ir-based systems(基於ir的系統)

基於ir的方法依賴於資訊檢索或最近鄰技術。假設輸入為s1,輸出為s2,ir-based的規則為r,那麼基於規則的對話系統的模式為s1,s2——>r,即s1和s2符合一定的規則。通常生成的響應與對話存在語義相關性(vsm、tf-idf、page-rank、推薦等排序方法)。該方式優點是比生成模型簡單,直接從訓練集中選擇答案,且可以新增自定義規則干預排序函式較為靈活;缺點是無法應對自然語言的多變性、語境解構、連貫性等,對語義的細微差別也無法識別,並且無法生成新的回答,因此也無法對未訓練的問題作出回答。

在本專欄中,簡單實現了乙個基於檢索的聊天機械人的實現,可以簡單看一下實現過程。

the generation-based systems (基於生成的系統)

基於生成的系統通過乙個詞乙個詞地生成句子,而不是複製來自訓練集的response。假設輸入為s1,輸出為s2,那麼基於生成的對話系統的模式為s1——>s2,即s1生成s2。在給定歷史對話的訓練集的情況下,系統需要輸出連貫且有意義的單詞序列。

基於生成的對話系統最早使用統計機器翻譯(statistical machine translation)的方式。但是基於mt的系統的缺點不僅在於mt模型的複雜性,單獨建立了許多不同的元件,而且mt模型在處理input and response pairs之間的隱式語義和句法關係時的固有不靈活性。由於這個原因,基於mt的系統僅僅善於處理少數情況。

近年來神經網路的發展,神經模型提供了隱式地學習input and response pairs之間的語義和語法關係的能力,並以常規smt-based和ir-based都不可能的方式捕獲上下文相關性。由於這些優點,神經生成模型能夠產生更具體,一致和有意義的對話反應。但是,還有一些重要的問題仍然沒有解決:現在的系統往往會產生簡單而遲鈍的反應,比如

「我不知道你在說什麼」,這明顯阻礙了談話繼續進行;

很難保持對話系統一致的身份或角色元素(背景事實或使用者簡介),語言行為或互動風格;

目前的系統往往只關注單輪對話,或者最多兩次,因為很難賦予系統長期的計畫能力,進行流暢,連貫,有意義的多回合對話。

該博士**將在以後幾章解決這些問題,我也會在我的[對話系統專欄](詳細分析解決方法。

對話系統一致的身份

長期對話的生成

對話生成的對抗性學習

從online學習,根據錯誤改進自己

口語對話管理綜述

口語對話管理綜述 對話系統的基本流程 1 語音識別 將使用者輸入的聲音轉化成文字 命令列輸入時可不用 asr 2自然語言分析 nlu 對asr輸出的文字進行分析,建立語義表示。3對話管理 核心部分,根據nlu分析出的使用者語義控制整個對話的進行 4後台資料庫 進行查詢資料 5自然語言生成 將文字結構...

推薦系統綜述

uir rui 是使用者u對物品i的實際評分,而r u i hat r ui 是推薦系統給出的 評分,則rmse定義為 mae定義為 topn推薦 此方法一般不考慮評分,而是為使用者提供乙個個性化推薦列表,通過 使用者對物品的興趣度對列表進行排序,選取其中前n個物品推薦給使用者,通常用於電子商務 社...

相機系統綜述 ISP

05 june 2016 isp image signal processor 即影象訊號處理器,用於處理影象訊號感測器輸出的影象訊號。它在相機系統中占有核心主導的地位,是構成相機的重要裝置。如下圖所示,isp 內部包含 cpu sup ip if 等裝置,事實上,可以認為 isp 是乙個 soc,...