IJCAI 2019 通過互動提公升機器翻譯質量

2021-09-24 17:15:25 字數 821 閱讀 4208

自從神經網路模型在機器翻譯任務(machine transoformer,mt)得到了應用,該任務得到了飛速的發展,機器翻譯的質量也在不斷地提高。儘管如此,機器翻譯的質量也難以與人類譯者相提並論。但是,有不少工作證明由人工介入機器翻譯過程對機器翻譯質量有明顯的幫助。本文提出了一種新的互動式機器翻譯模型(interactive machine translation, imt)來提公升機器翻譯質量,相比於過去單向的imt模型在測試集上達到了新的state-of-the-art。

互動式機器翻譯(interactive machine translation, imt)是在機器翻譯的基礎上,引入人工操作改善機器翻譯產生的翻譯錯誤,從而通過將修改資訊反饋給機器翻譯模型達到提公升機器翻譯質量的效果。但從早前的imt方法來看,imt存在著兩類問題。1)機器翻譯模型通常是以從左往右解碼的形式翻譯的,這導致因為錯誤積累而產生的嚴重錯誤會出現在翻譯結果的最右邊。而在人工審查時,錯誤的修改順序也是從左往右的,這使得最致命的錯誤無法第一實際得到修改。2)由於機器翻譯的模型引數固定,在面對類似語境下的句子會產生相同的錯誤,而早前的imt很少有關注修改的歷史記錄去避免相同錯誤。因此,如何優先處理致命錯誤以及如何利用修改記錄避免相同錯誤成為了imt研究中的難點。

**分別理想和實際實驗條件下進行了測試。

**提出了camit的模型架構,同時在解碼和再訓練方面增強了人機互動的效率,充分利用了人機互動帶來的資訊增強翻譯模型的效果。隨著翻譯技術的不斷進步,翻譯模型不僅僅依賴於先進的模型結構和優質的資料,也要依賴於大量的通過人機互動得到的互動資訊去補強自身的翻譯能力。在未來的發展中,人機互動、相互學習會成為機器翻譯技術甚至時人工智慧技術進步的關鍵。

掃碼識別關注,獲取更多新鮮**解讀

面試技巧 學會至少提公升 50 通過機率!

雖然標題可能會讓你有所懷疑,略有誇張,但是內容乾貨滿滿,保證受用。在動筆寫這篇文章之前,我看了很多面試技巧型別的文章,但是很少有讓我覺得眼前一亮的內容出現,絕大部分還是不夠貼合實際,而且寫的也很片面,沒有完整的體系。本文將從簡歷投遞開始,到面試前的準備直至面試過程中的技巧,將整個流程拆分詳解,將成體...

NAACL 2019 通過語料增廣進行語法糾錯

端到端序列模型 sequence to sequence framework 在最近幾年的語法糾錯 grammatical error correction,gec 任務上得到了普遍應用。然而,不像其他序列生成任務,如機器翻譯 mt gec受限於不夠充分的平行語料不能很好的產生效果。本文提出了兩種通...

賽車遊戲 一 通過藍芽實現兩個手機互動

這個例子是與 賽車遊戲 二 的例子相聯絡的,並通過藍芽實現人機互動。想執行這個應用程式,你需要兩個藍芽終端手機 例如 索尼愛立信 k750 並在啟動程式前連線這兩個手機。一旦通訊被建立,3d世界將啟動,每個玩家會看見兩輛賽車 他自己和對手。在 3d世界中,每位選手可以使用手機軟鍵來操縱他自己的賽車。...