百度發布AI同傳,詳解人工同傳與機器同傳優劣勢

2021-09-20 01:37:36 字數 2571 閱讀 4131

人工同傳與機器同傳的優劣勢

近年來,ai的發展對人類的職業造成很大的影響,不少領域的從業者都面臨著被ai替代的風險。據雷鋒網了解,ai已經替代了一些工廠裡機械化的工作,ai同傳的推出使得原本門檻較高的同傳領域也感受到了危機。

科大訊飛「ai同傳造假」事件引發大量關於人工同傳與ai同傳的討論,不少言論抨擊ai同傳目前技術尚未達到同傳要求,要替代人類同傳還言之尚早。

ai同傳目前無法取代人工同傳,而推出ai同傳的公司也不會誇口自己要去取代人工同傳。從這場爭論中,我們其實更清楚地明白人工同傳和ai同傳各自的優劣勢。

不過人工同傳也有一些劣勢:

1)精力體力的挑戰:與交替傳譯不同的是,同傳需要邊聽、邊記、邊翻,同步進行,對譯員的要求極高。由於需要高度集中注意力,人類同傳一般兩人一組,且每隔20多分鐘就要換人休息,對人的精力、體力都是極大的挑戰。

2)譯出率不高:據統計,同傳譯員的譯出率一般在60%-70%左右。譯出率不高的原因,一般由於未聽清或者難翻譯,人類譯員通常會選擇性的忽略某些句子,保證總體上的準確率和實時性。(譯出率:指實際翻譯的句子個數佔演講者總句子個數的比例,比如演講者說了100個句子,同傳實際翻譯了60個句子,則譯出率為60%。)

3)全球同傳譯員稀缺:由於苛刻的要求,全球同傳譯員稀缺,只有幾千人。與巨大的市場需求相比,人才嚴重短缺。且由於同傳譯員的稀缺性,高階同傳譯員**不菲,一般會議難以承受。

相比之下機器同聲傳譯的優勢有:機器最大的優勢是不會因為疲倦而導致譯出率下降,能將所有「聽到」的句子全部翻譯出來,這使得機器的「譯出率」可以達到100%,遠高於人類譯員的60%-70%。同時,在**上也占有優勢。

但是,機器同傳傳譯也有劣勢:受限於語音識別及機器翻譯技術,目前機器同傳的總體翻譯質量與人類相比還有較大差距。主要面臨以下挑戰:

1)語音識別錯誤:由於演講者的口音、語速以及會場的雜訊影響,語音識別通常會存在一定的錯誤率,這錯誤會在翻譯中進一步放大。例如「我們在酒店大堂見面吧」,如果「大堂」被錯誤的是別為「大唐」,雖然只是錯了乙個字,但是就會導致翻譯完全錯誤。解決這一問題,需要從兩方面下功夫,一是高質量的語音識別系統,二是具有容錯能力、高魯棒性的翻譯模型。

2)質量與時延的平衡:同傳最具魅力的地方在於其低時延,這對於人類也是乙個極具挑戰性的任務。高質量翻譯和低時延之間存在天然矛盾。要想獲得高質量的翻譯,需要等待演講者更多的資訊,時延就會變長。如果追求低時延,需要在演講者還未說完一句話的情況下,就開始翻譯,會損失掉一些資訊,造成翻譯質量不高。這在中英、中日等詞序差異較大的語種中體現更為明顯。

例如在漢語句子中「布希**在莫斯科會見普京」,漢語動詞「會見」出現在句子末尾,而在翻譯為英語時,需要將動詞」meet」提前。

人類語言中詞序的這種差異一直是人類同聲傳譯員和可靠的同聲機器翻譯系統發展的主要障礙。目前,幾乎所有的「實時」翻譯系統仍然使用傳統的全句(即,非同時的)翻譯方法,造成至少乙個句子的延遲,使得譯文與說話者不同步。

3)小語種覆蓋難題:目前絕大多數的翻譯硬體,都侷限在幾個大語種範圍內。

4)讓實時語音翻譯或更大概念上的翻譯成為一種平台化的資源:如何讓實時語音翻譯,或者更大概念上的翻譯,成為一種平台化的資源,這既是各個公司產品商業化的考量,也是人工智慧普惠化的終極目的。

1) 高質量語音識別系統

1、基於「協同發音」的一級切分,發音和聽覺領域知識check,刻畫「協同發音」導致的音素黏連物理特性;

2、基於「統計共現」的二級切分,中文n-gram的分詞方案,同等黏連下等價於中文分詞;

3、基於資料驅動的「中英文音節」繫結和多發音標註方案,解決「b超」和「必超」、「大地」和「大d」類的問題。在模型結構方面,我們採用底層cnn+多層lstm+一層dnn的模型結構,並且採用ctc作為優化準則。該方案很好的解決了實際場景中遇到的中英文混合場景,同時能夠保持中文效能不降低,在國際化溝通日益頻繁引入的中文中混合有部分英文短語的場景得到良好解決。

2) 高魯棒性翻譯模型

3) 質量與時延的平衡

該模型乙個顯著的優點是其具有可調節性,達到質量和時延的平衡。使用者可根據需要指定所需的延遲時間(比如,延遲一詞或延遲五詞)。如果是法語和西班牙語這種比較接近的語言,延遲可設定在比較低的水平,因為就算是逐詞翻譯的效果也很好。但是,對於英語和漢語這種差異較大的語言,以及英語和德語這種詞序不同的語言,延遲應當設定高一點,以獲得更高的翻譯質量。

4) 融合領域知識

人類同傳譯員在接到乙個同傳任務時,都會做大量的功課,掌握所譯領域的術語詞彙、表達方式等。然而留給同傳譯員準備的時間卻很有限,一般僅有幾天的時間,在一些術語量大、晦澀難懂的領域,對人類譯員是乙個極大的挑戰。

該方法模擬人類同傳準備過程,且優勢明顯, 準備過程短,只需要將領域資料在通用模型基礎上進行訓練,數小時即可得到優化後的模型,術語詞典生效時間更是縮小到秒級,大大提公升了效率。

目前的技術,機器同傳離人類專家的水平仍然有較大差距。尤其是在重要會議如外交、商務等場合,必須依靠人類同傳高質量、專業的翻譯完成。現階段,機器同傳可以作為人類同傳的輔助手段或者有效補充,例如有大量的會議,聘請專業同傳費用太高或者沒有相關領域的同傳譯員,此時可以借助於機器同傳完成。會議舉辦方、演講者、聽眾充分認識到機器同傳的優勢和侷限性,容忍機器犯錯,就可以達成共識,促進交流。

百度排名11位現象詳解 人工干預VS演算法規則

11位現象一直是站長討論的最為火爆的乙個話題。許多站長反映新站,老站都會出現這種情況。目前網路流傳的11位現象,非排名機制 演算法規則 更新,存在人工干涉降權情況。所謂無法恢復,那是自己做優化的經驗不夠,沒有用心去做優化。排名11位是指你的站點中流量不錯的主要關鍵詞 有些流量的,排名前幾位的 排名從...

人工智慧ai下海百度雲 雲AI就像核電

在最近的一次演講中,谷歌和alphabet首席執行官sundar pichai呼籲在ai領域制定新的法規,重點顯然是ai已被雲計算商品化。鑑於我們正在辯論圍繞ai技術使用的道德問題,這不足為奇 最重要的是,ai對於企業和不良參與者而言,如何輕鬆地為計算 化。也在infoworld上 人工智慧可以真正...

百度 AI 人工智慧服務 C 呼叫使用記錄

持續更新中 在控制台建立對應的應用 windows 下開發環境配置 c 獲取 access token c base64 編譯碼原理及實現 通用物體和場景識別高階版 c 簡單呼叫 影象主體檢測 c 簡單呼叫 動物識別 c 簡單呼叫 植物識別 c 簡單呼叫 logo 識別 c 簡單呼叫 果蔬識別 c ...