2017年9月初,數(shù)百名機(jī)器翻譯研究人員將降臨丹麥哥本哈根。他們?cè)诘诙脵C(jī)器翻譯大會(huì)(WMT17)上找出了誰(shuí)的機(jī)器翻譯系統(tǒng)最好。
競(jìng)爭(zhēng)很激烈。2016年,從20多個(gè)機(jī)構(gòu)近200個(gè)MT系統(tǒng)提交并評(píng)估了10個(gè)不同的所謂任務(wù)。
自2006年以來(lái),WMT每年舉行一次,首次以年度研討會(huì)的形式舉行。隨著近期MT研究的熱潮,2016論壇升級(jí)為會(huì)議。
WMT17是在2017年9月7日至11日召開的自然語(yǔ)言處理經(jīng)驗(yàn)方法會(huì)議(EMNLP 2017)上召開的,由計(jì)算語(yǔ)言學(xué)協(xié)會(huì)組織。

對(duì)人工智能和自然語(yǔ)言處理等子領(lǐng)域的興趣激增對(duì)組織者來(lái)說(shuō)是一個(gè)福音,他們說(shuō)注冊(cè)量比最初的估計(jì)高出150%。
為了找出哪個(gè)系統(tǒng)是最好的,WMT17為研究人員提供了八個(gè)常見的任務(wù),包括新聞翻譯、生物醫(yī)學(xué)翻譯、自動(dòng)后期編輯和神經(jīng)MT(NMT)系統(tǒng)的訓(xùn)練。事實(shí)上,2017年是研究人員提交NMT任務(wù)的第一年。2016年,NMT仍然只是作為一個(gè)“感興趣的話題”被提及。
新聞翻譯分享任務(wù)的初步結(jié)果是有的,無(wú)論是人工評(píng)測(cè)還是自動(dòng)評(píng)測(cè)。一些組織者進(jìn)行的自動(dòng)評(píng)估結(jié)果也已公布。此外,會(huì)議文件草稿已在網(wǎng)上提供。所有共享任務(wù)的最終結(jié)果將在會(huì)議期間公布。
WMT 2017的主要組織者包括約翰·霍普金斯大學(xué)語(yǔ)言和語(yǔ)音處理組教授、全知科技首席科學(xué)家Philipp Koehn和愛丁堡大學(xué)高級(jí)研究員巴里·哈多。
在列出的21個(gè)組織者中,有來(lái)自海德堡大學(xué)、愛丁堡大學(xué)和布魯諾·凱斯勒基金會(huì)的代表。
在WMT規(guī)劃委員會(huì)的115名研究人員中,約有四分之三來(lái)自學(xué)術(shù)界,七名來(lái)自愛丁堡大學(xué),六名來(lái)自阿姆斯特丹大學(xué),四名來(lái)自卡爾斯魯厄理工學(xué)院。
蘇黎世大學(xué)的Martin Volcker最近獲得了他的NMT項(xiàng)目的研究資金,紐約大學(xué)的Kyunghyun Cho也將出席,他將在即將舉行的SlatorCon new york conference上發(fā)表演講。
大型技術(shù)公司已經(jīng)涉足WMT多年,2017年,如IBM、谷歌、亞馬遜、微軟。公司計(jì)劃委員會(huì)中有好的代表。臉書顯然不存在。2017年8月初,宣布徹底轉(zhuǎn)型為神經(jīng)MT。
WMT發(fā)布的成果已經(jīng)成為大規(guī)模的技術(shù)。公司學(xué)術(shù)研究人員和研究團(tuán)隊(duì)評(píng)估其系統(tǒng)的關(guān)鍵基準(zhǔn)。
然而,商業(yè)機(jī)器翻譯提供商往往遠(yuǎn)離WMT的競(jìng)爭(zhēng),因?yàn)樗婕皫讉€(gè)月的準(zhǔn)備,結(jié)果是不確定的。如果你的系統(tǒng)排在下半部分,它就不能上市。
然而,例如,商業(yè)提供商將使用WMT來(lái)對(duì)他們的系統(tǒng)進(jìn)行基準(zhǔn)測(cè)試,并在為新的語(yǔ)言組合開發(fā)系統(tǒng)時(shí)使用獲得的BLEU分?jǐn)?shù)來(lái)進(jìn)行完整性檢查。
在WMT之后的主要EMNLP會(huì)議上,機(jī)器翻譯,尤其是神經(jīng)機(jī)器翻譯的會(huì)議將被強(qiáng)調(diào)。這些會(huì)議將與關(guān)于機(jī)器學(xué)習(xí)、多語(yǔ)言自然語(yǔ)言處理(NLP)、NLP應(yīng)用和語(yǔ)言理論的討論一起舉行,僅舉幾例。
編者按:本文已更新,包括新聞翻譯分享任務(wù)的初步結(jié)果。把這個(gè)信息交給Tilde的研究員MārcisPinnis,交給我們。
編譯:語(yǔ)言學(xué)家上海翻譯公司