聊天機械人到底該怎麼做呢?

2021-09-23 06:08:50 字數 1615 閱讀 6004

我:chatbot,你好!

chatbot:你也好!

我:聊天機械人可行嗎?

chatbot:你不要懷疑這是天方夜譚,我不就在這裡嗎?世界上還有很多跟我一樣聰明的機械人呢,你聽過ibm公司在2023年就研發出來了的watson問答系統嗎?它可比我要聰明100倍呢

我:噢,想起來了,據說watson在智力競賽中竟然戰勝了人類選手。但是我了解到它有一些缺陷:因為它還只是對資訊檢索技術的綜合運用,並沒有進行各種語義關係的深刻計算,所以它能回答的問題也僅限於實事類的問題,所以它能贏得也就是知識類的智力競賽,如果你給它出個腦筋急轉彎,它就不行了

chatbot:是的呢,所以你任重道遠啊

我:chatbot,我問的每一句話,你都是怎麼處理並回答我的呢?

chatbot:我身體裡有三個重要模組:提問處理模組、檢索模組、答案抽取模組。三個模組一起工作,就能回答你的問題啦

我:是嘛,那麼這個提問處理模組是怎麼工作的呢?

我:那麼這個查詢關。。。

我:原來是這樣,提問處理模組這三項工作我了解了,那麼檢索模組是怎麼工作的呢?

我:那麼答案抽取模組呢?

chatbot:答案抽取模組可以說是計算量最大的部分了,它要通過分析和推理從檢索出的句子或段落裡抽取出和提問一致的實體,再根據概率最大對候選答案排序,注意這裡是「候選答案」噢,也就是很難給出乙個完全正確的結果,很有可能給出多個結果,最後還在再選出乙個來

我:那麼我只要實現這三個模組,就能做成乙個你嘍?

chatbot:是的

我:chatbot,小弟我知識匱乏,能不能告訴我都需要學哪些關鍵技術才能完成我的夢想

chatbot:小弟。。。我還沒滿月。說到關鍵技術,那我可要列一列了,你的任務艱鉅了:

1)海量文字知識表示:網路文字資源獲取、機器學習方法、大規模語義計算和推理、知識表示體系、知識庫構建;

2)問句解析:中文分詞、詞性標註、實體標註、概念類別標註、句法分析、語義分析、邏輯結構標註、指代消解、關聯關係標註、問句分類(簡單問句還是複雜問句、實體型還是段落型還是篇章級問題)、答案類別確定;

3)答案生成與過濾:候選答案抽取、關係推演(並列關係還是遞進關係還是因果關係)、吻合程度判斷、雜訊過濾

chatbot:看你這麼好學,那我就多給你講一講。聊天機械人的技術可以分成四種型別:1)基於檢索的技術;2)基於模式匹配的技術;3)基於自然語言理解的技術;4)基於統計翻譯模型的技術。這幾種技術並不是都要實現,而是選其一,聽我給你說說他們的優缺點,你就知道該選哪一種了。基於檢索的技術就是資訊檢索技術,它簡單易實現,但無法從句法關係和語義關係給出答案,也就是搞不定推理問題,所以直接pass掉。基於模式匹配的技術就是把問題往已經梳理好的幾種模式上去靠,這種做推理簡單,但是模式我們涵蓋不全,所以也pass掉。基於自然語言理解就是把淺層分析加上句法分析、語義分析都融入進來做的補充和改進。基於統計翻譯就是把問句裡的疑問詞留出來,然後和候選答案資料做配對,能對齊了就是答案,對不齊就對不起了,所以pass掉。選哪個知道了嗎?

我:知道了!基於自然語言理解的技術!so easy!媽媽再也不用擔心我的學習!o(╯□╰)o

chatbot:好,那我的任務結束啦,我該走了,再見!

我:不要走——不要走——ka ji ma——

在呼喚chatbot的聲音中,我從夢中醒來,這時我才意識到這是乙個夢,揉揉雙眼,突然發現床邊有一張紙,上面寫著:

聊天機械人

我你好!小愛同學 小愛你好,很高興認識你!charset utf 8 css document 休息一會 sleep 1 獲取 使用者傳送的 訊息 可選 後端 對於 使用者發過來的 時候 是否 使用 可選 根據 傳送 過來的 訊息 返回 不同的內容 messagelist array 床前明月光,有...

機械人聊天軟體c C 聊天機械人

例項簡介 c 聊天機械人 例項截圖 核心 3181078聊天機械人 原始碼必讀.pdf 聊天機械人 1.ico 聊天機械人 1.ico form1.designer.cs form1.cs form1.resx program.cs properties assemblyinfo.cs resour...

聊天機械人ELIZA

1 在 自然語言理解 這本書的緒論中曾分析了聊天機械人eliza的設計機理,表明這是一種語言變換的技巧,而不是真正的 自然語言理解 午間休息時檢索了一下,找到了乙個它的連線 它並不如書中所舉的例子那樣的 聰明 也許因為這是第乙個聊天機械人,以及它並沒有真正採取 自然語言理解 的技術有關。下面是筆者與...