史上最強DIY,手工製作乙隻會說話的機器狗

2021-10-23 14:10:35 字數 1338 閱讀 7162

波士頓動力的機器狗了解嗎?

乙個會後空翻、會開門、會爬樓梯的ai。

最近,我們實驗室就來了一批mini版的機器狗,雖然不會各種高難度雜技動作,但在我們各種搗鼓下,現在特別「能說會道」。

目標:乙隻具備語音互動的機器狗

當前,採用api訪問雲端實現諸如語音識別、語音合成模組功能,逐漸可以簡化或者取代一些複雜的本地資源部署,快速實現相應的功能。

但對於一些語音互動科研機械人,語音服務經常面臨本地部署裝置數目少、部署成本高、維護麻煩等問題。

尋求低成本、部署方便、語音合成迅速的語音互動服務模組,成為設計語音互動機械人的關鍵瓶頸。

這次,我們對機器狗科研demo樣機搭載語音識別asr、自然語言處理nlp、語音合成tts服務,從而實現準確快速的語音識別、多音色富有情感的語音合成、語音運動控制、智慧型提醒等功能。

針對上述要求,我們選用了華為雲的語音識別asr、語音合成tts以及自然語言處理nlp產品。具體實驗改造過程其實很簡單,分為三步:

在本地裝置部署語音喚醒服務,裝置語音喚醒後,將錄音片段通過華為雲的語音識別介面傳至華為雲進行語音識別處理。

將華為雲返回的語音識別文字資訊在本地進行自然語言處理,或運用華為雲的自然語言處理模組進行自然語言處理得到相應的語義、控制指令資訊。

將需要語音合成的文字通過華為雲的語音合成介面傳至華為雲,得到相應的音訊資訊。

圖:業務架構圖/方案截圖

誕生!乙隻可對話的機器狗

控制指令識別:通過語音識別服務,在本地通過正則匹配,資料庫對比等操作,得到語音資訊中的控制指令資訊,用於機械人的語音控制。

對話語音的語音轉寫:運用語音識別服務,獲取語音資訊中相應的文字資訊,用於自然語言處理模組的文字輸入,或者對話機械人api的輸入。

語音合成功能:運用華為雲的語音合成服務實現對答文字的語音合成服務。

雖然身形沒有波士頓動力的機器狗靈巧,但是在語音對話方面,這只機器狗或許要略勝一籌。

體驗下來,華為雲的語音識別類產品還是相當不錯的,首先它簡化了語音互動模組的配置,學生可以輕鬆通過api呼叫的方式實現語音識別、語音合成等服務,簡單便捷。

現在,華為雲的語音識別產品正在優惠中,1元就能體驗語音語義服務,一分錢不花也可以享受一天的智慧型對話機械人,算下來,至少能省幾大百,喜歡diy機械人的趕緊上車。【傳送門】

廢舊光碟手工小製作 如何用廢光碟製作DIY蜂鳥掛飾

現在已經很少人會利用光碟來記載和傳送資料了,如果家裡還有cd光碟,一般也極少會聽。今天的廢光碟diy教你如何使用報廢的cd光碟製作乙個有趣的diy啄木鳥掛件,用於家庭裝飾或者店鋪布置,幾乎不花錢就能完成乙個很有手工藝範兒的有趣吊飾。如果你也喜歡鳥兒,參考下面費寶網給你介紹的方法來進行廢光碟妙用,做乙...

史上最強的黑客

這是我當黑客以來接到的一項最具挑戰性的生意,是去黑另乙個黑客的電腦。工欲善其事,必先利其器,我很明白現今裝備的重要性,於是我把自己從頭武裝到腳,包裝上了全黑的緊身夜行衣和戴上墨鏡。這樣我看起來就很黑很客,很重很要了。一出門,我就給車撞了 司機下車後,打著強光手電筒找了好半天才找得到躺在地上的我,說了...

史上最強Git教程

史上最強 git教程 1.git 分布式倉庫 git是乙個開源的分布式版本控制系統,用於敏捷高效地處理任何或小或大的專案。git 與常用的版本控制工具 cvs,subversion 等不同,它採用了分布式版本庫的方式,不必伺服器端軟體支援。詳情參考 使用git前,需要先建立乙個倉庫 reposito...