計算機輔助翻譯概述 xg_第1頁
計算機輔助翻譯概述 xg_第2頁
計算機輔助翻譯概述 xg_第3頁
計算機輔助翻譯概述 xg_第4頁
計算機輔助翻譯概述 xg_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、計算機輔助翻譯概述 第一頁,共二十六頁。第二頁,共二十六頁。第三頁,共二十六頁。語言服務(wù)人才技能語言基礎(chǔ)交流溝通行業(yè)知識項目經(jīng)驗職業(yè)道德IT技術(shù)現(xiàn)代語言效勞人才素質(zhì)需求第四頁,共二十六頁。過硬的英中文表達、轉(zhuǎn)換能力信息技術(shù)根底知識熟練利用多種網(wǎng)絡(luò)檢索技術(shù)來獲取信息和知識熟練掌握各類輔助翻譯/電子工具熟練根本的翻譯規(guī)那么和流程知識廣博,并且精通某一行業(yè)領(lǐng)域的知識能夠承受工作壓力,按照客戶要求及工程方案控制工程進度和質(zhì)量團隊協(xié)作精神貫穿整個翻譯工作流程,翻譯、編輯、校對、工程、測試等恪守職業(yè)道德,敬業(yè)態(tài)度、忠誠、責(zé)任心、細心、保密 平安新一代語言效勞人才素養(yǎng)要求第五頁,共二十六頁。第六頁,共二十六

2、頁。1.信息技術(shù)支持2.協(xié)同翻譯模式3.標準工程管理4.市場需求導(dǎo)向文本處理、機器翻譯、翻譯記憶、術(shù)語庫、語料庫、百科全書、在線詞典、搜索引擎、專業(yè)資料等協(xié)同翻譯、角色分工、資源共享角色分工、行業(yè)標準關(guān)注市場需求、實用文體、專業(yè)翻譯我們的教學(xué)與現(xiàn)實的差距?第七頁,共二十六頁。HT Human TranslationCAT Computer-aided Translation MT Machine Translation幾個術(shù)語第八頁,共二十六頁。IT:自動化程度劃分人機結(jié)合,各得其所Hutchins & Somers, 1992參見短片:認識不同的翻譯軟件 什么是CAT第九頁,共二十六頁。參見

3、 馮志偉?機器翻譯研究?2004.中國對外翻譯出版公司制造一種機器,讓使用不同語言的人無障礙地自由交流,一直是人類的一個夢想。MT早于計算機(1629,笛卡爾)機器翻譯的研究始于上世紀四十年代。機器翻譯(Machine Translation):利用計算機及其軟件把一種語言(自動)翻譯成為另外一種語言的技術(shù)。MT:開展歷程第十頁,共二十六頁。MT:開展歷程1933-1954, 初創(chuàng)階段1949年,Warren Weaver提倡MT研究翻譯的過程可用解密過程(decoding)來類比1954-1966,開展階段Georgetown+IBM 第一個俄英翻譯實驗1966-1976低潮難以跨越的 “語

4、義障礙(semantic barrier),機器翻譯很困難,這個結(jié)論來之不易ALPAC(自動語言處理參謀委員會,Automatic Language Processing Advisory Committee)報告1976-復(fù)蘇第十一頁,共二十六頁。機器翻譯研究的開展歷程70年代,機器翻譯研究開始復(fù)蘇TAUM-METEO系統(tǒng)獲得成功歐共體啟用SYSTRAN系統(tǒng)人工智能、知識工程進展的影響。80年代,機器翻譯研究呈繁榮局面,系統(tǒng)產(chǎn)品出現(xiàn)日本實施五國合作的ODA方案歐盟實施Eurotra方案多個公司推出了MT產(chǎn)品機器翻譯方法的進展90年代,平臺. 難以提高,新方法出現(xiàn)1999. 統(tǒng)計MT突破機器翻

5、譯方法的多樣化第十二頁,共二十六頁。機器翻譯的理論根底或類型:Rule/StatisticsWhenever I fire a linguist, our system performance improves 1988Some of my Best Friends are Linguists. 2004 Frederick JelinekJulian Sinclair Smith Professor, Department of Electrical and Computer EngineeringJohns Hopkins University Yorick Wilks Professor

6、 of Artificial IntelligeceDepartment of Computer ScienceUniversity of SheffieldStone soup第十三頁,共二十六頁。MT是語言學(xué)問題詞序I have enjoyed hearing about your experience in Africa.多義詞 spririt介詞The fish was bought by the cook/river. 連詞and 問題It is necessary to study the history and grammar of Chinese language.參見劉涌泉

7、1997I saw a girl with a telescope in the bank.第十四頁,共二十六頁。理性主義的規(guī)那么-智能法直接轉(zhuǎn)換 transfer中間語言interlingua經(jīng)驗主義的語料統(tǒng)計法統(tǒng)計機器翻譯 statistical MT基于實例的機器翻譯Example-based MT詞典+規(guī)那么語料+統(tǒng)計Give me enough parallel data, and you can have translation system for any two languages in a matter of hours. Franz Joseph Och Stone sou

8、p “統(tǒng)計+規(guī)那么英漢機器翻譯測試大綱 (俞士汶)機器翻譯的根本類型第十五頁,共二十六頁。基于實例的機器翻譯Example Based Machine Translation(EBMT) 1984年由日本著名機器翻譯專家長尾真提出 背景建立在轉(zhuǎn)換根底上的機器翻譯系統(tǒng),在差異較大語言對間進行互譯時,效果不好人在翻譯時不做深層次語言學(xué)分析人在學(xué)外語的時候,首先要作大量的對照記憶,在遇到新的句子時,會和記憶中的句子類比建立基于類比思想的機器翻譯第十六頁,共二十六頁?;趯嵗臋C器翻譯根本思想主要知識庫是雙語對照的實例庫當(dāng)需要翻譯一個新句 子時,通過檢索的方法在實例庫中尋找和該句類似的翻譯實例。新句子

9、的翻譯可通過模擬最類似的實例的譯文的方式獲得。第十七頁,共二十六頁。基于實例的機器翻譯EBMT的優(yōu)點系統(tǒng)維護容易* 系統(tǒng)中知識以翻譯實例和義類詞典等形式存在,可以很容 易的利用增加實例和詞匯的方式擴充系統(tǒng)。容易產(chǎn)生高質(zhì)量的譯文* 尤其是利用了較大的翻譯實例或和實例精確匹配時更是如 此??煞乐惯M行深層次的語言學(xué)分析第十八頁,共二十六頁。基于實例的機器翻譯EBMT的關(guān)鍵問題 大規(guī)模的雙語語料庫 雙語對齊問題* 語篇、句子、短語和詞匯等各種級別 建立合理的相似度準那么 高效的實例檢索機制 譯文生成翻譯記憶技術(shù)和基于模板的翻譯技術(shù)第十九頁,共二十六頁?;诮y(tǒng)計的機器翻譯Statistic-Based

10、Machine Translation(SBMT) 50年代初曾有提及,遭到以Chomsky為代表的語言學(xué)家的反對90年代初,統(tǒng)計翻譯技術(shù)復(fù)蘇 統(tǒng)計技術(shù)在語音識別領(lǐng)域獲得成功 目前計算機性能已能勝任密集型計算 目前也有大量聯(lián)機雙語電子文本第二十頁,共二十六頁。不能完全指望機器翻譯詞典詞庫廣泛性:收錄夠不夠詞條描寫性:框架適宜不適宜詞典適應(yīng)性:加載不同屬性詞典規(guī)那么規(guī)那么廣度與精度規(guī)那么沖突的解決數(shù)據(jù)是否有足夠多的語料是否有較好的算法Will you marry me新造詞是否有對應(yīng)譯法? 不折騰嫁給我/娶我mouse第二十一頁,共二十六頁。關(guān)于CAT全自動高質(zhì)量翻譯FAHQT不行,CAT呢計算

11、機輔助翻譯的主體是誰?計算機輔助翻譯的主體是人。相比照較容易,很實用。人機結(jié)合,各得其所機器儲存、記憶能力人工智能核心:翻譯記憶(相似性的評判標準)適用于標準、重復(fù)性高的文本.Eg. Office 2003 Office 2007 Documents盡可能大而全的語料、盡可能好而快的算法.第二十二頁,共二十六頁。狹義與廣義翻譯技術(shù)翻譯技術(shù)表達為一組翻譯工具,是假設(shè)干軟件工具的集合。計算機輔助翻譯CAT關(guān)注的是“如何應(yīng)用計算機軟件,最大限度地實現(xiàn)翻譯流程的自動化,提高人工翻譯的效率,保證人工翻譯的質(zhì)量,并能夠管理翻譯流程第二十三頁,共二十六頁。CAT,范圍較廣,但凡有助于翻譯的IT工具上傳下載:

12、 Email /FTP/ Portal虛擬系統(tǒng):登陸客戶方系統(tǒng)翻譯殺毒防毒: kaspersky, 360;網(wǎng)絡(luò)收藏夾:資源分類和整理即時交流: MSN, Skype、QQ系統(tǒng)管理: 分割、壓縮(WinZip、WinRar)文檔分類管理多媒體工具:Open Subtitle Translator輔助寫作工具: Arbortext排版工具:處理不同格式資料備份與同步:輸入法:手寫閱讀瀏覽 PDF文本處理工具: Word、UltraEdit、EditPlus,文字處理常用的快捷鍵文字識別 OCR文檔處理工具(文檔轉(zhuǎn)換): SnagItSpell checkerGrammar checkerDictionary搜索工具Full-text search google電子詞典Concordancer (語料庫)Bitexts第二十四頁,共二十六頁。第二十五頁,共二十六頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論