智慧型語音技術助力,推進人機互動新時代

2021-08-17 11:42:03 字數 1111 閱讀 2758

過去的70年,人機互動形式不斷進化,從計算機時代的鍵盤,到智慧型手機時代的觸控螢幕,如今語音互動正在引領人工智慧為主導的下乙個人機互動的新時代,它能夠在社交、導航、搜尋、機械人等領域大規模應用。

起初智慧型語音備受公眾關注還是由於蘋果siri的出現。實際上,siri並按不是手機上出現的第乙個智慧型語音助手,最早出現的語音助手的弊端在於只能聽話,不能說話,這在一定程度上桎梏了他們的發展速度。

而當年市場上出現的語音產品,給使用者的普遍的感受是智慧型化程度不夠高。對於一些關於日常的衣食住行或是相對簡單的問題,這些語音助手基本上都能夠給予相對明確的答覆,但是對於一些稍微複雜的問題,儘管與其交流的時候「雞同鴨講」得挺熱鬧,但通常給出的答案都是模糊兩可或者乾脆打起了太極。

在產品應用方面,智慧型語音最初只能在銀行櫃檯、醫院排號,以及**呼叫中心這場景中應用。體驗者與產品互動過程中聽到的是充滿機械感的聲音,試問在聽到**那頭冷冰冰的:「普通話服務請按1...」的時候,你有沒有馬上轉人工服務的衝動?

隨著人工智慧技術的高速發展,語音技術在語音識別和語義分析上日趨成熟的技術上繼續蓬勃發展,更多能聽懂人類,或者能與人類深刻交流的智慧型產品將不斷豐富大眾的生活。

微軟小冰、siri等人工智慧語音產品為當今社會提供了很多應用場景,如:查詢實時天氣、播報新聞簡訊、體育賽事、推薦熱門電影、出行導航,還能控制物聯網開啟電燈、窗簾和咖啡機......語音智慧型產品的應用,讓整個人工智慧產業擁有了更大的想象空間。

如今,我們期待智慧型語音產品不僅能「說人話」,而且能「更像人」,「懂你」,只是個開始,語音智慧型最重要的部分,在於情感化的tts。標貝科技上線的tts評測系統讓客戶可以專心於合成技術的研發,快速實現高質量的合成系統,為針對韻律、多音字、數字符號及分詞詞性四個模組進行客觀測評,結合abx、mos評分評測,為提公升語音系統合成效果提供更高效的方案。

在昨天(3月22日),微軟(亞洲)網際網路工程院宣布推出新一代的語音互動技術:全雙工語音互動感官。與既有的單輪或多輪連續語音識別不同,這項新技術可實時**人類即將說出的內容,實時生成回應並控制對話節奏,從而使長程語音互動成為可能。

未來,語音智慧型的發展方向,其實很簡單,就是如何解決語音識別、語義理解、操作執行等存在的問題。

(原創)用訊飛語音實現人機互動的功能

目前在做一款車載的專案,其中有乙個需求是在開車的時候實現人與手機的對話,全過程不需要用手,只用語音操控。這個就類似於人與機械人的對話,機械人在後台一直待命,使用者說話 機械人做出對應的反映。但由於使用者手機電源的寶貴性,又不能讓使用者一直開著錄音監聽,這樣很耗費資源。因此使用了訊飛語音提供的喚醒功能...

語音識別的最終目標是真正實現人機互動

人工智慧一直是乙個有趣的話題。有教育背景的人,面對人工智慧發表意見,人工智慧的未來發展。2016年是人工智慧真正意義上的第一年。無論是人工智慧技術人員的儲備,還是技術產業領導者在人工智慧領域的投資,都在迅速創新。為什麼近年來智慧型家居的繁榮一直沒有起到作用,市場也看不到智慧型家居的產品,都是因為我們...

人機互動 讓IT技術融入社會生活

哈佛大學chia shen教授展示的人機互動新介面 人機互動 human computer interaction,hci 研究在計算機領域乃至整個人類社會中扮演著越來越重要的角色。3月15日和16日,微軟亞洲研究院 人機互動學會中國分會 中國計算機學會及清華大學共同舉辦了為期兩天的2010中國人機...