機(jī)器翻譯(MT)不僅不是所有翻譯人員曾經(jīng)認(rèn)為的破壞行業(yè)的怪物,而是在翻譯領(lǐng)域被證明是一項(xiàng)令人難以置信的有益發(fā)展,它使我們的生活變得更加輕松,我們的工作也更加出色。
我無(wú)法想象,在他們的日常工作中,甚至還有一位翻譯仍然在使用任何類型的高級(jí)MT工具。和大多數(shù)翻譯事物一樣,我發(fā)現(xiàn)我的思維定期翻過(guò)機(jī)器翻譯的奧秘 - 我總是有一個(gè)以謎題為導(dǎo)向的大腦,弄清楚事情的運(yùn)作方式是我的一點(diǎn)興趣。所以我最近對(duì)MT的工作方式進(jìn)行了一些個(gè)人研究,這不僅有點(diǎn)引人入勝。

基于規(guī)則的翻譯
幾十年來(lái),機(jī)器翻譯工具(當(dāng)然,我們幾乎完全用計(jì)算機(jī)工具來(lái)講)使用了所謂的“基于規(guī)則”的范例。這涉及創(chuàng)建極其復(fù)雜的規(guī)則集,試圖通過(guò)一系列語(yǔ)句來(lái)描述語(yǔ)言。翻譯記憶可能是基于規(guī)則的概念的最終表達(dá):在源語(yǔ)言中使用短語(yǔ),對(duì)其進(jìn)行解析,然后將其與目標(biāo)語(yǔ)言中的短語(yǔ)集合進(jìn)行匹配。如果比賽達(dá)到100%,請(qǐng)繼續(xù)并替換該短語(yǔ)。如果沒(méi)有,將它歸還給人類。
隨著計(jì)算機(jī)技術(shù)領(lǐng)域中速度和處理能力的驚人進(jìn)步,這種基于規(guī)則的機(jī)器翻譯近年來(lái)變得非常有用,因?yàn)樘幚硭俣瓤朔朔妒降墓逃袑擂魏偷托剩@非常相似在一張紙上遞給我一個(gè)句子,然后把我放在一個(gè)圖書館并告訴我瀏覽每本書,直到找到匹配的句子,然后把那本書帶給你。是的,它有效,但它起作用的唯一原因是因?yàn)槲沂敲孛艿某?,可以在幾秒鐘而不是幾個(gè)世紀(jì)內(nèi)進(jìn)行搜索。
統(tǒng)計(jì)翻譯工具
機(jī)器翻譯中的新思維是避開(kāi)嚴(yán)格的規(guī)則,而是從統(tǒng)計(jì)上考慮語(yǔ)言。在利用翻譯記憶庫(kù)的同時(shí),新方法在統(tǒng)計(jì)上權(quán)衡了所有可能的匹配,并選擇最可能正確的解決方案。這允許系統(tǒng)在新文檔上和現(xiàn)有文檔一樣工作,因?yàn)槟恍枰獮槊總€(gè)新作業(yè)重新構(gòu)建翻譯記憶庫(kù)數(shù)據(jù)庫(kù),但可以依靠統(tǒng)計(jì)模型在現(xiàn)有文檔中找到適當(dāng)?shù)钠ヅ漤?xiàng)。數(shù)據(jù)庫(kù)。該系統(tǒng)基本上生成幾個(gè)可能的匹配,統(tǒng)計(jì)地對(duì)它們進(jìn)行加權(quán),然后向用戶呈現(xiàn)最可能的選擇。
這是一種全新的方法,它在節(jié)省時(shí)間和翻譯準(zhǔn)確性方面帶來(lái)了巨大的收益,但它并非萬(wàn)無(wú)一失,因此許多翻譯專業(yè)人士都反對(duì)這種新思維。正如機(jī)器翻譯本身一樣,我希望在幾年內(nèi)我們都將使用基于統(tǒng)計(jì)的工具。