september 12-16, 2005
phuket, thailand
the tenth machine translation summit, organized by the asia-pacific association for machine translation (aamt), will be held at phuket island, thailand in september 2005.
***,趙老師於9.12-9.16參加了在泰國普及島舉辦的mt summit x峰會。9-19下午兩點,也就是今天下午,趙老師給實驗室的學生們講了他參會的感受,以下是我聽完趙老師感受後的一些感受。
mt summit 至今已舉辦十屆,由美國、歐洲、亞洲三方輪流主辦。本屆在亞洲,舉辦者為aamt,其實就是清一色日本人。世界上在mt方面的研究勁旅主要是:老美、歐洲、日本。
1 會議概況:
據趙老師介紹會議的規模還算大, 超過200人註冊。會議日程 – 每天上下午各有1~2個特邀報告,此外還有3個研討會(panel),分組報告安排得較為鬆散。特邀報告共有10個報告,其中來自中國4個。從此也可以看出作為主辦方的日本對中國的重視。
2特邀報告:
本次大會是中國研究人員向世界介紹我們研發活動的一次盛會:
劉偉權博士介紹北京奧運會多語資訊服務系統與mt引擎
劉群博士介紹863mt評測情況
徐波教授介紹中國smt研究概況和相應的workshop
黃河燕教授介紹中國商業mt系統的研發
在這些特邀報告中屢次提及哈工大。
從上面的資訊中可以看出,劉偉權博士是08奧運資訊服務的負責人,而劉群是以前就很熟悉的研究者,才知道他就是負責863評測的。徐波這個人要注意一下,徐是863專家,在自動化所是高新科技轉化的負責人,而且他對mt的前景很樂觀,特別是他有志於在smt方面做出點事業來。黃河燕教授是中科院計算所下屬華建公司的負責人同時是中科院計算所的教授博導。
3 demo:
參展單位:
日本5家(nict,atr, fujitsu,oki,toshiba)
泰國2家(tcl,nectec)
中國2家(casia, hit)
德國1家(dfki)
趙老師認為總體上反響不很熱烈,atr的語音翻譯多人試用,其他較冷清。比較相關的是,prof. nagao參觀並提問我們的ebmt系統。比如例項如何匹配,例項庫如何存放、建設等等問題。赫赫,有點意思,看來我們以後一定要多多找機會"班門弄斧"一下,也好得到些寶貴建議。
值得一提的是fujitsu由於老師帶隊,而toshiba則由王海峰博士領銜,王他們參展的系統包括j-e,e-j,e-c,其中e-c系統是由王一手組織研發的。其中王用rbmt系統翻譯的乙個關於介紹紐約的**的demo感覺非常棒了,不過兩年前demo的也是同樣水平。:d
對於使用者方面,趙老師作了如下總結:
使用者對於機器翻譯系統總的需求不減,用途多樣化
手機廠商nokia了解手機翻譯的可能性
泰國一家公司對中泰語言互譯感興趣,集中在旅遊和商務
多語資訊處理資源受到重視
美國mitre公司/日本nict收集資源資訊
mitre公司隸屬於tides計畫,公司人員對參加會議的人員都認真記錄了情況。
4 會議**集情況 :
– 41 presentation / 22 posters
分布 –
resource 6
user study 3 / practical system 6 / localization 2
smt 3 / corpus-based mt 3 / methodology 6
evaluation 2 / analysis 3 / speech3
5 會議整體感受(趙)
樂觀估計-mt系統即將實用化的前夜 / smt備受矚目
歐美、日本再掀研發高潮
國內一些單位正準備奮力一搏(e.g.自動化所,徐波)
應用和系統互動-北京奧運專案,多種技術結合(通訊,多**…)
對我們mt研發情況的反省:
我們面臨著壓力挑戰,也存在機會
mt研發滑坡,重視不夠
缺乏長期的部署和得力的程式設計實現
借鑑多年的積累,能否在今後一年半改進或重整我們mt系統框架
以系統為研究平台,掌握最新技術,不能處於研究圈子之外
mt技術離不開mt系統
demo系統 - 研究平台
評測推進系統改進
在沒有明確的應用之前,參加評測是主要推動
深入分析系統問題,實驗改進,探索新方法,發表高水平**
調整整合我們的mt研究部署
mt涉及的問題多,把人力集中到乙個系統中(如果可能的話)
相關技術和工具有步驟地改進
加強演算法研究和錯誤分析,有針對性地創新
攻關與長期、有步驟的計畫結合
技術實現上的一點想法
統計框架,短語翻譯為核心(自動化所系統、och/ney報告、panel討論等均論及此)
smt借鑑或融合ebmt思想(smt and ebmt astonishingly separate research communities - och)
一些技術的應用 – 短語對齊、單語chunking、語言模型等
知難而進,發奮圖強,迎頭趕上
目標 – 躋身國內漢英-英漢機器翻譯評測結果最好單位之列(bleu/nist評分相差不多) / 國內外圈子裡始終有我們的聲音
我們還有機會!
側記: 楊老師在會後發表了一下他自己的感覺,他認為在mt界現在英雄的作用何其之大,以och對於isi的作用為例,並提出問題誰會是中國的och.
編碼規範之感想
說說編碼規範吧,以前感覺不到編碼規範的重要性,總抱著 老子天下第一 的心態在那編碼,想在哪加個方法就加個方法,變數命名想到什麼就是什麼,有時候連個簡單的注釋都找不到。雖然有時候自己寫的 隔個幾天自己看起來也有點困難,但是編碼的邏輯還是符合個人的思路,多看幾遍也就看懂了。我曾經有個同事,因公出差了乙個...
學習MCGS之感想
最近在學習mcgs,此軟體是北京崑崙通泰自動化軟體科技 研發的。從小學到高中所學,均為全人類或國家所認可,大都是蓋棺定論的知識。這些知識都由無數天才的汗水澆灌而成,閃爍著神聖的光輝。大學期間接觸過mcgs,當了解到這是乙個小公司研發的東西,而且介面非常山寨,心理頓時充滿了鄙夷,還是學學高大上的c 吧...
STL原始碼分析之感想
現在是2005年4月22日,17 54,完整分析stl源 結束,我終於可以松了一口氣,感想頗多呀 特別是對stl的熟練的使用,讓我在平時的開發工作中大大提高了開發的效率,比如我前一段時間開發的一些 元件,以及曲線控制項,因為我用的是atl,所以我不用mfc,這樣stl的優點就能很好的發揮出來,後來慢...