翻譯記憶庫(kù)(TM)實(shí)際上允許針對(duì)大量檢索條件存儲(chǔ)和檢索對(duì)齊的多語(yǔ)言文本片段。TM系統(tǒng)不同于原文中存儲(chǔ)的信息和檢索方法。
翻譯記憶庫(kù)的功能主要分為離線和在線兩大類。離線功能包括分析、導(dǎo)入和導(dǎo)出,在線功能包括翻譯。這就好比數(shù)據(jù)庫(kù)在其管理和數(shù)據(jù)庫(kù)中的操作。
離線功能

離線功能主要包括導(dǎo)入、分析和導(dǎo)出詳細(xì)信息。
導(dǎo)入:導(dǎo)入功能將文本及其翻譯從文本文件傳輸?shù)椒g記憶庫(kù)??蓮耐獠縼?lái)源獲得的原始格式數(shù)據(jù)及其轉(zhuǎn)換被導(dǎo)入到TM中。這種數(shù)據(jù)導(dǎo)入需要系統(tǒng)外的用戶對(duì)文本進(jìn)行預(yù)處理,還需要在系統(tǒng)內(nèi)對(duì)文本進(jìn)行交互式編輯。這個(gè)案例涉及的列表是輸入格式,預(yù)處理,后期編輯。原生格式也用于將舊格式導(dǎo)入新格式,并將翻譯記憶保存在文件中。這種格式保留了分段、對(duì)齊和控制信息。其清單包括本機(jī)格式和TM組合使用的格式。
分析:在提交翻譯之前,在導(dǎo)入TM或單語(yǔ)文本之前處理多語(yǔ)言文本,并在每種情況下定義輸入和輸出。它涉及到對(duì)源文本和目標(biāo)文本的解析,這個(gè)過(guò)程涉及的步驟如下。
文本解析:識(shí)別標(biāo)點(diǎn)符號(hào)對(duì)于區(qū)分標(biāo)點(diǎn)符號(hào)非常重要。標(biāo)簽構(gòu)成某種預(yù)編輯,包含在翻譯的輔助程序中。不同的格式約定和標(biāo)記語(yǔ)言是良好分析的標(biāo)志。其他特殊文本元素,如代碼、名稱、數(shù)字、日期和貨幣,不需要翻譯。
語(yǔ)言分析:單詞和文本列表是通過(guò)基本形式縮減(也稱為形態(tài)縮減)準(zhǔn)備的,用于從詞匯表中檢索術(shù)語(yǔ)。短語(yǔ)識(shí)別用于從源文本中提取多詞術(shù)語(yǔ)。語(yǔ)言分析對(duì)于規(guī)范術(shù)語(yǔ)的詞序變化是必要的。
切分:切分的目的是選擇有用的翻譯單位。它是一種分析,利用曲面分析來(lái)完成。分段過(guò)程中涉及的清單是輸入格式、分段定義、輸出格式和用戶干預(yù)的可能性。一個(gè)句子的翻譯取決于所附的譯文;然而,翻譯是在翻譯的過(guò)程中一句一句地進(jìn)行的。
對(duì)齊:源對(duì)象和目標(biāo)文本之間的轉(zhuǎn)換對(duì)應(yīng)關(guān)系在對(duì)齊中定義。它為分割提供反饋,理想情況下,它可以糾正初始分割。
術(shù)語(yǔ)抽取:是自動(dòng)分析階段,也叫詞匯。它還估計(jì)翻譯中涉及的工作量,通常稱為文本統(tǒng)計(jì)。
導(dǎo)出:它包括將文本從內(nèi)存轉(zhuǎn)移到外部文本文件。
在線功能
TM的實(shí)用目的是為用戶提供最佳的翻譯選擇。TM的在線功能包括下面提到的先決條件;
必須顯示響應(yīng)的源文本和目標(biāo)文本。
必須指出查詢和響應(yīng)之間的區(qū)別和相同之處。
必須根據(jù)偏好評(píng)估響應(yīng)的替代方案。
響應(yīng)必須容易地插入到響應(yīng)中。
但是,在線翻譯記憶庫(kù)的功能是;
搜索不同類型的比賽。當(dāng)源段和存儲(chǔ)段按字符匹配時(shí),將出現(xiàn)精確匹配。范圍從0到100%的模糊匹配發(fā)生在沒(méi)有找到精確匹配的地方。
當(dāng)翻譯者接受新的翻譯時(shí),TM數(shù)據(jù)庫(kù)被更新??梢酝ㄟ^(guò)刪除和更改TM中可用的條目來(lái)修改它。在某些情況下,會(huì)為一個(gè)段保存多個(gè)翻譯。
自動(dòng)翻譯是TM工具中的自動(dòng)檢索和替換。當(dāng)譯者在文檔中移動(dòng)時(shí),結(jié)果會(huì)自動(dòng)顯示。如果找到完全匹配,自動(dòng)替換就完成了。
該網(wǎng)絡(luò)允許翻譯團(tuán)隊(duì)聚在一起,通過(guò)將一個(gè)譯者的短語(yǔ)和句子提供給另一個(gè)譯者來(lái)更快地翻譯文本。然而,TM的共享打開(kāi)了更多的機(jī)會(huì)和選擇。