版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Computer-AssistedTranslationTranslationMemoryToolsMachineTranslationTheCorpus-BasedApproachTranslationMemory(翻譯記憶)NotMachineTranslation(MT)Esselink:“Atechnologythatenablestheusertostoretranslatedphrasesorsentencesinaspecialdatabaseforlocalre-useorshareduseoveranetwork.TMsystemsworkbymatchingtermsandsentencesinthedatabasewiththoseinthesourcetext.Ifamatchisfound,thesystemproposestheready-madetranslationinthetargetlanguage.”技術(shù)原理:用戶利用已有的原文和譯文,建立起一個(gè)或多個(gè)翻譯記憶庫(kù)(TranslationMemory),在翻譯過(guò)程中,系統(tǒng)將自動(dòng)搜索翻譯記憶庫(kù)中相同或相似的翻譯資源(如句子、段落),給出參考譯文,使用戶避免無(wú)謂的重復(fù)勞動(dòng),只需專注于新內(nèi)容的翻譯。翻譯記憶庫(kù)同時(shí)在后臺(tái)不斷學(xué)習(xí)和自動(dòng)儲(chǔ)存新的譯文,變得越來(lái)越“聰明”,效率越來(lái)越高。幾乎所有翻譯記憶廠家都會(huì)告訴用戶:有了TM,你永遠(yuǎn)不必對(duì)同一句話翻譯兩遍!翻譯記憶優(yōu)缺點(diǎn):翻譯質(zhì)量有保證隨著使用時(shí)間匹配成功率逐步提高特別適用于重復(fù)率高的文本翻譯,例如公司的產(chǎn)品說(shuō)明書的新版本翻譯與語(yǔ)言無(wú)關(guān),適用于各種語(yǔ)言對(duì)缺點(diǎn)是匹配成功率不高,特別是剛開(kāi)始使用時(shí)CurrentexamplesofTMtoolsSDLTradosStudio2009/2011/2014Wordfast(Classic/Pro)TransitNXTDVXOmegaTMemoQ
AcrossMultiTrans
SDLTradosStudio
SDL
Trados是世界上最流行的計(jì)算機(jī)輔助翻譯(CAT)軟件,在全球擁有13萬(wàn)多客戶,全球500強(qiáng)企業(yè)有超過(guò)90%的公司都在使用SDLTrados來(lái)為日常的本地化翻譯工作服務(wù),SDLTrados為他們克服了在不同國(guó)家地區(qū)的文化、語(yǔ)言障礙,從而為他們的全球化鋪平了發(fā)展道路。
用戶:微軟、Cisco、Intel、HP、Compaq、DELL、Oracle、SAP、宏碁(Acer)、德國(guó)大眾、上海大眾、西門子、朗訊、北方電訊、Wal-Mart(沃爾瑪)、聯(lián)合國(guó)、歐盟、國(guó)際貨幣基金組織、雅虎、新浪、深圳華為、深圳中興、上海貝爾阿爾卡特、廣州石化等。MachineTranslation國(guó)內(nèi)市場(chǎng)上的翻譯軟件(四大類):全文翻譯(專業(yè)翻譯):雅信CAT2.5
在線翻譯:火云譯客、金山快譯.net2001、華建的“翻譯網(wǎng)上通”
漢化軟件:東方快車3000
電子詞典:金山詞霸.net2001
金山快譯:我過(guò)去一直有三輛汽車。我無(wú)法在我的小車庫(kù)中使他們保持所有的。我停車了在我的房子周圍的某處。但是我昨天偷一輛汽車。東方快車:我過(guò)去常有3輛汽車。我都不能把他們放在我的小車庫(kù)。在我的房子附近我停車了某地。但是我把了一輛汽車昨天被偷竊。例:
Iusedtohavethreecars.Icouldn’tkeepthemallinmysmallgarage.Iparkedsomewherearoundmyhouse,butIhadacarstolenyesterday.例:Hewasintheseventhheavenlastnight.金山快譯:他昨晚是在第七天堂方面;東方快車:昨晚他在第7天堂;參考譯文:昨晚他欣喜若狂。
Yourbrainhastwoparts:theleftandtheright.Yourleftbrainhasnothingright,andyourrightbrainhasnothingleft。
你的大腦有兩部分:左邊的和好的。左腦有什么權(quán)利,你的右腦有一無(wú)所有
你的大腦有兩部分:左和右。你的左腦沒(méi)有正確的,你的右腦沒(méi)剩下什么東西。(白癡,腦殘,胸?zé)o點(diǎn)墨)MT限制:人名翻譯習(xí)語(yǔ)翻譯文學(xué)作品翻譯成語(yǔ)典故的翻譯存在語(yǔ)義歧義時(shí)人名:金庸LouisCha—JinYong
彭定康——Patten(ChristopherFrancispattern)LarryPage(拉里·佩奇)——佩奇習(xí)語(yǔ):海誓山盟-eternal
asolemnpledgeoflovetocarrycoaltoNewcastle
運(yùn)煤到紐卡斯?fàn)柕溒鹗拤Γ═roublebreaksoutathome)Harris別狗咬呂洞賓,不識(shí)好人心。MT:Thedogbitelvdongbindoesnotknowgoodhearts.
HT:Don'tbitethehandthatfeedsyou.成語(yǔ)典故:文學(xué)作品:明月幾時(shí)有,把酒問(wèn)青天MT:Whenthemoonis,wineaskbluesky.HT:Whenwillthemoonbeclearandbright?Withacupofwineinmyhand,Iaskthebluesky.Shesailedintotheroom.有道:她順利地進(jìn)了房間。參考:她儀態(tài)萬(wàn)方的走進(jìn)了房間。歧義:他說(shuō):“她這個(gè)人真有意思(funny)”。她說(shuō):“他這個(gè)人怪有意思的(funny)”。于是人們以為他們有了意思(wish),并讓他向她意思意思(express)。他火了:“我根本沒(méi)有那個(gè)意思(thought)”!她也生氣了:“你們這么說(shuō)是什么意思(intention)”?事后有人說(shuō):“真有意思(funny)”。也有人說(shuō):“真沒(méi)意思(nonsense)
”。語(yǔ)料庫(kù)(Corpora)的定義按照一定的原則組織在一起的真實(shí)的自然語(yǔ)言數(shù)據(jù)(包括書面語(yǔ)和口語(yǔ))的集合,主要用于研究自然語(yǔ)言的規(guī)律,特別是統(tǒng)計(jì)語(yǔ)言學(xué)模型的訓(xùn)練以及相關(guān)系統(tǒng)的評(píng)價(jià)和評(píng)測(cè)。一個(gè)由大量在真實(shí)環(huán)境中使用的語(yǔ)言信息所集成的專供研究使用的資料庫(kù)。Corpus-basedsystem
基于語(yǔ)料庫(kù)的機(jī)器翻譯系統(tǒng)概念:不同于基于規(guī)則的機(jī)譯系統(tǒng)由詞典和語(yǔ)法規(guī)則庫(kù)構(gòu)成翻譯知識(shí)庫(kù),基于語(yǔ)料庫(kù)的機(jī)譯系統(tǒng)是以語(yǔ)料庫(kù)的應(yīng)用為核心,由經(jīng)過(guò)劃分并具有標(biāo)注的語(yǔ)料庫(kù)構(gòu)成知識(shí)庫(kù),以統(tǒng)計(jì)規(guī)律為主。分類:
(1)基于統(tǒng)計(jì)(Statistics-based)的機(jī)器翻譯
(2)基于實(shí)例(Example-based)的機(jī)器翻譯基于統(tǒng)計(jì)(Statistics-based)的機(jī)器翻譯統(tǒng)計(jì)機(jī)器翻譯的基本思想是通過(guò)對(duì)大量的平行語(yǔ)料進(jìn)行統(tǒng)計(jì)分析,構(gòu)建統(tǒng)計(jì)翻譯模型,進(jìn)而使用此模型進(jìn)行翻譯。通俗地說(shuō),源語(yǔ)到目的語(yǔ)的翻譯是一個(gè)概率統(tǒng)計(jì)問(wèn)題,任何一個(gè)目的語(yǔ)句子都有可能是任何一個(gè)源語(yǔ)句的譯文,只是概率不同,機(jī)器翻譯的任務(wù)就是找到概率最大的句子。具體方法是將翻譯看做對(duì)原文通過(guò)模型轉(zhuǎn)換為譯文的解碼過(guò)程。
1、模型問(wèn)題:就是為機(jī)器翻譯建立概率模型,也就是要定義源語(yǔ)到目的語(yǔ)的翻譯概率的計(jì)算方法。
2、訓(xùn)練問(wèn)題:利用語(yǔ)料庫(kù)來(lái)得到這個(gè)模型的所有參數(shù)。
3、解碼問(wèn)題:在已知模型和參數(shù)的基礎(chǔ)上,對(duì)于任何一個(gè)輸入的源語(yǔ)言句子,去查找概率最大的譯文我是一個(gè)學(xué)生Iamastudent詞語(yǔ)對(duì)齊實(shí)例源短語(yǔ)表短語(yǔ)組合表例句:Wedochickenright.1.我們做雞是對(duì)的。2.我們做雞正點(diǎn)耶。3.我們就是做雞的,我們有做雞的權(quán)利。4.我們只做雞的右半邊。5.我們可以做雞,對(duì)吧?6.我們行使了雞的權(quán)利。7.我們只做右邊的雞。8.我們讓雞向右看齊。9.我們只做正版的雞!10.只有朝右才是好雞。11.我們有雞的權(quán)利!12.只有我們可以做雞!13.我們“正在”做雞好不好?14.向右看,有雞。15.我們讓雞變右撇子。16.我們一定要把雞打成右派!17.我們做的是“右派”的雞?。湲?dāng)勞做的是“左派”的雞!)18.我們只做右撇子雞!19.我們干雞的右邊。20.我們把雞搞正?。ㄔ瓉?lái)是歪的)21.我們“躲”在雞的右懷里。22.我們做雞,怎么啦?23.雞的左邊留給麥當(dāng)勞干。24.我們知道怎么做雞。25.我們知道如何做“雞”。26.雞做得對(duì)!27.你知道我們正在做雞。28.我們只做正點(diǎn)的雞!29我們烹雞的方式最正確。/我們是烹雞專家。應(yīng)用:Google的在線翻譯已為人熟知,其背后的技術(shù)即為基于統(tǒng)計(jì)的機(jī)器翻譯方法,基本運(yùn)行原理是通過(guò)搜索大量的雙語(yǔ)網(wǎng)頁(yè)內(nèi)容,將其作為語(yǔ)料庫(kù),然后由計(jì)算機(jī)自動(dòng)選取最為常見(jiàn)的詞與詞的對(duì)應(yīng)關(guān)系,最后給出翻譯結(jié)果。此外,Bing翻譯和百度翻譯等優(yōu)缺點(diǎn):翻譯質(zhì)量的高低主要取決于概率模型的好壞和語(yǔ)料庫(kù)的覆蓋能力?;趯?shí)例(Example-based)機(jī)器翻譯提出:最早是由日本的機(jī)器翻譯專家長(zhǎng)尾真1981年提出的?;舅枷耄涸谝呀?jīng)收集的雙語(yǔ)實(shí)例庫(kù)中找出與待翻譯部分最相似的翻譯實(shí)例,再對(duì)實(shí)例的譯文通過(guò)替換,刪除或增加等一系列變形操作,實(shí)現(xiàn)翻譯?;趯?shí)例的機(jī)器翻譯系統(tǒng)主要由兩個(gè)數(shù)據(jù)庫(kù)(實(shí)例庫(kù)和同義詞庫(kù))以及兩個(gè)模式(檢索模式和調(diào)整模式)組成。
實(shí)例庫(kù)(雙語(yǔ)語(yǔ)料庫(kù))同義詞庫(kù)(語(yǔ)義詞庫(kù)、詞典詞庫(kù))↙↘↙↘待翻譯句子→相似實(shí)例檢索→重組與調(diào)整→翻譯結(jié)果待翻譯句子:Fathergoestobedat11intheevening.相似句子:Mothergetsupat6inthemorning.
母親早上六點(diǎn)起床。重組調(diào)整:父親晚上11點(diǎn)上床。我給瑪麗一支筆——IgaveMaryapen.我給湯姆一本書——Ig
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《綜合布線結(jié)構(gòu)圖》課件
- 小學(xué)數(shù)學(xué)一年級(jí)上冊(cè) 三1-5的認(rèn)識(shí)和加減法 第四節(jié) 幾和幾 教案
- 湖南省株洲市2025屆高三上學(xué)期教學(xué)質(zhì)量統(tǒng)一檢測(cè)化學(xué)答案
- 高考新課標(biāo)語(yǔ)文模擬試卷系列之60
- 《辦公室的設(shè)計(jì)》課件
- 娛樂(lè)服務(wù)員工作總結(jié)
- 駕駛培訓(xùn)車輛租賃合同三篇
- 服裝行業(yè)采購(gòu)經(jīng)驗(yàn)分享
- 教育行業(yè)校園安全預(yù)案編制
- 信息安全行業(yè)技術(shù)崗位總結(jié)
- 公交車站臺(tái)服務(wù)規(guī)范與安全意識(shí)
- 2024電商消費(fèi)趨勢(shì)年度報(bào)告-flywheel飛未-202412
- 慢阻肺護(hù)理個(gè)案病例范文
- 《農(nóng)機(jī)安全》課件
- 公共廁所清潔保養(yǎng)協(xié)議
- 浙江省溫州市2023-2024學(xué)年六年級(jí)上學(xué)期期末科學(xué)試卷(含答案)3
- 深圳大學(xué)《激光原理與技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 西安市高新第一中學(xué)八年級(jí)上冊(cè)地理期末試卷(含答案)
- 2024年廣東省深圳市中考英語(yǔ)適應(yīng)性試卷
- 普法學(xué)法知識(shí)考試題庫(kù)(100題附答案)
- DB37-T 1722-2024公路工程高性能瀝青混合料施工技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論