自然語言處理在工業設計中的研究與應用 服務機械人

2021-09-24 13:51:44 字數 4381 閱讀 6667

隨著人們對人工智慧研究的深入 ,越來越多的服務機械人進入普通家庭 ,幫助年輕人照顧老人、小孩 , 減輕他們的負擔 。 為了更好地服務人類 ,降低人類操作機械人的難度 ,最方便、最有效的方式是使用人 類的自然語言操作機械人。 因而 ,在機械人與人類的互動中 ,自然語言處理便是核心要點 。 自然語言 資訊方便了人們的日常交流 ,但是對於機械人來說 ,資訊搜尋難、資訊迷失和資訊超載等問題都阻礙了機 器人與人的直接交流 ,要想讓機械人在豐富的自然語言資訊中獲取到人們希望機械人完成的任務變得很 困難 ,這就要求提高機械人資訊檢索效率來幫助機械人獲取人類希望它們知道的資訊 。 在資訊檢索 中 ,可以通過搜尋關鍵字資訊來分析資訊含義 ,幫助機械人理解自然語言 ,完成處理自然語言任務。 

在自然語言處理中 ,目前比較流行的處理技術僅僅是簡單的搜尋匹配 ,在程式中盡可能地擴大處理自 然語言的案例數 ,來實現自然語言處理。 在任務規劃中 ,目前較成熟的技術是回答集程式設計(asp)技術 , asp是一種非單調推理程式設計技術 ,已成為很多研究者用於非單調推理的知識表示和推理工具 ,可以解決 服務機械人指令語言任務規劃這種非單調問題 。asp技術在服務機械人自然語言任務資訊的應用中 , 求解效率不是很高 ,為了提高機械人的自然語言理解能力 ,**中採用關鍵字搜尋演算法處理自然語言 ,利 用改進的asp技術進行任務規劃。 相比於以處理自然語言案列為物件來處理自然語言的方法 ,關鍵字搜 索演算法通過處理並分析自然語言句子中的若干關鍵字來理解整個句子所表達的意思 ,增加自然語言處理 的通用性 ,簡化了程式從自然語言轉換為指令語言的處理 ,降低了時間複雜度 ,提高了自然語言識別效率 ; 再利用改進的asp技術進行任務規劃和動作規劃 ,使用特定的模型求解例項化的程式 ,可以提高服務機 器人的資訊獲取和動作規劃的效率 ,最終提高了機械人對自然語言的理解能力。 為了驗證該演算法的執行 效果 ,以中國機械人大賽中家庭服務機械人**專案為測試平台 ,解決平台中自然語言處理問題 ,提高機 器人任務求解效率。

1.自然語言處理流程

1.1處理問題描述

場景抽象為乙個 10 m× 10 m大小的室內環境 ,其內部規定了機械人的屬性以及當前環境下出現的 物體及其屬性。 機械人被抽象為乙個有機械手和托盤且可移動的 3d**機械人模型 ,機械手可以拿物 體 ,托盤可以裝物體 ,機械人可以隨意移動到場景中的任何位置 ;場景中存在大物體和小物體 ,大物體有獨 立的物體和可以裝小物體的容器 ,這些物體有編號、種類、位置、大小、顏色等屬性 ,其中物體編號可以唯一 確定某乙個物體。

在任務描述中 ,任務描述型別分為三種 :目標、資訊和約束。 目標表示平台要求機械人完成的工作 ;信 息表示機械人還可以從場景中獲取到的額外資訊 ;約束表示機械人在執行任務時不能執行的動作 ,或者過 程中必須保持某一場景狀態的約束條件 。 在任務表示方式上 ,平台採用受限的詞彙組成英文句子來 描述 ,即自然語言描述方式。

1.2自然語言處理演算法介紹

處理上述問題時 ,主要採用的是關鍵字搜尋演算法。 利用某個或某些關鍵字資訊匹配出英文句子中的 詞彙 ,根據匹配出關鍵字含義或關鍵字組合含義 ,利用分組標記 ,謂詞轉換等處理方法 ,分析出整個句子所 表達含義 ,從而完成機械人對自然語言理解的演算法。

在演算法中 ,關鍵字一詞 ,英文表達為「keywords」 ,指乙個句子中能概括表達出整句意思的某個或某幾 個詞語 ,獲取這些關鍵字可以分析整句話表達的意思 ,不需要處理整個句子中其他部分。對於句子中的關 鍵字 ,利用關鍵字搜尋演算法中匹配模式 ,遍歷句子中所有詞彙 ,匹配出句子中的關鍵字 ,根據匹配出的關鍵 字資訊進行進一步分析。 基於關鍵字搜尋演算法處理自然語言 ,具有操作方便、查詢詞彙全面等優點。

1.3自然語言處理過程

為了解決自然語言處理問題 ,採用一種支援家庭服務機械人**專案的自然語言處理體系結構,將自然語言處理過程分成兩個模組 ,即自然語言預處理模組和任務規劃模組。 自然語言預處理模組包含格式化、分組標記和謂詞集轉換。在預處理階段 ,通過格式化處理 ,將平台中 自然語言描述的任務資訊處理為便於機器處理的格式 ,利用關鍵字搜尋演算法 ,理解句子表達的含義 ,使用分 組標記和謂詞轉換等自然語言處理技術 ,將自然語言格式的任務描述處理為指令格式 ,為任務規劃做準備。

任務規劃模組包括場景資訊識別、指令語言任務規劃和asp規則編寫。 利用實驗平台提供的場景信 息和經預處理轉換的指令語言任務資訊 ,獲得場景的初始狀態和機械人需要完成的任務 ,編寫asp規則 並呼叫iclingo求解器 ,求解出一組機械人執行的動作序列。

2. 自然語言預處理

2.1格式化處理

通過關鍵字來分析自然語言表達的含義 ,有利於自然語言的預處理工作 ,將其「翻譯」為指令語言格 式 ,進而有利於使用回答集程式設計(asp)技術進行任務規劃和動作規劃。下面將詳述格式化處理 ,分組標記 和謂詞集轉換這三個步驟 ,來論述預處理過程。 和謂詞集轉換這三個步驟 ,來論述預處理過程。

以英文句子來描述自然語言格式的任務資訊 ,會存在字母大小寫、空格等情況 ,這在以某些合成詞為關 鍵字資訊時 ,需要使用多組詞彙進行匹配 ,以「keyboard」為例 ,在句子可能有多種形式出現 ,如「keyboard」、 「keyboard」、 「keyboard」等 ,在搜尋「keyboard」時 ,需要進行多種情況匹配 ,增加了程式的時間複雜度。

2.2關鍵字分析

完成格式化處理後 ,在進行分組標記之前 ,需要對**平台中的詞彙進行關鍵字分析和預處理 ,便於 將不同任務資訊進行分類處理。 用於實驗的測試平台提供有限詞彙(表 1)。 名詞是用來儲存任務的對 象、形容詞是用來描述名詞的特性 ,程式不用專門處理 ;代詞在平台中只有乙個「me」 ,特指場景中的使用者 , 自動處理為「human」即可 ;動詞包括目標中的實意動詞 ,可能代表乙個目標或者約束 ,在處理時能夠直接 判斷它具體代表什麼型別的目標 ;介詞表示兩個物體之間的關係 ,過去分詞表示物體的狀態 ,若程式只搜 索到這兩類詞 ,那麼它可能是乙個補充資訊 ;助動詞「must」和「be」 ,在英文中 ,它帶有情感色彩 ,可能會描 述為約束資訊 ,因此程式需要先搜尋判斷 ;冠詞如果出現在句子中 ,一般是幫助機械人定位小物體 ,可以和 名詞 ,形容詞一起處理 ;副詞中的「there」可以用來表達陳述句 , 「not」可以用來否定 ,都需要進行搜尋判斷其表達的任務型別。

對於有實際意思的任務動詞 ,可以進行搜尋 ,直接判斷其表達任務的含義。 若在一條任務資訊裡找到 give、pick、 take、put、go、open、 close這些動詞 ,這樣的一條任務可能是包含完成目標或者約束中的不能執 行的目標。 只要獲取到動詞 ,並獲取動詞後面的名詞 ,即可分析出這條任務。 例項第 2 條關鍵字分析如 下 :動詞「give」、名詞「can」和「human」、介詞「on」 ,該句子可以分析為目標。

2.3分組標記

經過關鍵字分析後 ,可以得到動詞大多數情況包括了任務資訊中的目標 ;介詞大部分情況包括了任務 資訊中的補充資訊 ;而任務資訊中的約束主要根據關鍵字「not」和「must」判斷的 ,剩下部分可處理為目標 資訊或補充資訊。 利用分組標記的方法處理自然語言描述的任務資訊 ,可以將任務資訊的組成部分分為 目標組塊、服務組塊、描述組塊、位置組塊、「not」標記組塊和「must」標記組塊 ,若不滿足其中的基本組塊 , 則標記為null。 在**平台中 ,對5 種任務型別使用分組標記進行句法分析。

3. 自然語言任務規劃

3.1指令任務規劃

經過自然語言預處理後 ,**平台能夠得到指令語言任務描述 ,之後利用回答集程式設計(asp)技術進行 指令語言任務規劃 ,生成相應的待執行動作序列。回答集程式設計(asp)作為具有非單調推理能力的知識表 示和推理工具 ,可以將場景資訊、指令語言任務資訊等外部輸入資訊轉換為相應的asp規則 ,描述機械人 對環境的感知和其行動能力 ,並利用這些資訊進行任務規劃 ,解決自然語言指令任務規劃的問題。asp的求解包括兩個步驟 :(a)例項化 ,將程式中含有的變數例項化為相應的例項。(b)模型搜尋 ,計算例項化後程式的回答集。

3.2 例項分析

為了提高回答集程式設計(asp在自然語言任務規劃中的求解效率,可以使用關鍵字搜尋演算法處理自然 語言 ,再使用asp對處理後的指令語言任務進行求解。利用關鍵字之間的關係 ,可以將相關的原子動作進行合併 ,進而可以提高asp的搜尋空間 ,使程式的時 間複雜度下降 ,縮短機械人執行動作時間 ,提高asp的求解效率。

4. 結果與分析

為測試關鍵字搜尋演算法在自然語言資訊處理中的效果 ,以及在較大資料下的計算效能 ,試驗採用中國機 器人大賽中家庭服務機械人**專案為測試平台。測試平台提供自然語言描述的場景資訊和任務資訊,使用者程式識別並解析場景和任務相關的資訊 ,通過演算法求解出合理的行動序列來完成任務要求,平台根據程式 執行時間、已完成的任務數、遵守約束數、執行動作數和問題求解效率綜合給出使用者程式的最終評分。

從上述對比試驗可以看出,關鍵字搜尋演算法在處理家庭服務機械人**專案的自然語言任務處理中具 有良好的效果,其中大部分情況的自然語言資訊都被準確地「翻譯」為指令語言,大多數任務所獲得的分數都 明顯高於簡單處理情況,該演算法提高了服務機械人自然語言規劃效率。在自然語言指令規劃中 ,自然語言準 確地轉換為指令語言,對下一步的任務規劃有很大的幫助作用,在大量資料的測試過程 ,關鍵字搜尋算 法能夠將絕大部分的自然語言準確地翻譯成指令語言,為回答集程式設計(asp)技術進行任務規劃做好了良好 的預處理工作 ,同時也間接地改善了asp任務規劃的效能,最終提高了自然語言處理整體效率。

自然語言處理研究綜述

自然語言是指漢語 英語 俄語等人們日常使用的語言,區別於人工語言,如程式設計的語言。自然語言處理,是指用計算機對自然語言的形 音 義等資訊進行處理,即對字 詞 句 篇章的輸入 輸出 識別 分析 理解 生成等的操作和加工。實現人機間的資訊交流,是人工智慧界 電腦科學和語言學界所共同關注的重要問題。自然...

國內自然語言處理研究組

清華大學自然語言處理與人文計算實驗室 清華計算機系前院長孫茂松教授是他們的leader 清華大學智慧型技術與系統國家重點實驗室資訊檢索組 北京大學計算語言學教育部重點實驗室 北大計算機學科比較有實力的乙個研究方向之一 北京大學計算機科學技術研究所語言計算與網際網路挖掘研究室 中科院計算所自然語言處理...

自然語言處理簡介及研究方向

自然語言處理是電腦科學領域與人工智慧領域中的乙個重要方向。它研究能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。自然語言處理是一門融語言學 電腦科學 數學於一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯絡,但又有重要的區別。自然語言...