搭建屬于自己的機(jī)器翻譯系統(tǒng)_第1頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第2頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第3頁
搭建屬于自己的機(jī)器翻譯系統(tǒng)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、搭建屬于自己的機(jī)器翻譯系統(tǒng) MTI專業(yè)“技術(shù)小白”走進(jìn)小牛翻譯開源社區(qū)的心得首先,自我介紹一下。 我是一個(gè) MTI(翻譯碩士 )專業(yè)、 沒有計(jì)算機(jī)編程背景、 沒有機(jī)器 翻譯理論基礎(chǔ)的菜鳥, 任職于一家網(wǎng)絡(luò)科技公司的市場部門, 之前的工作中需要做些翻譯工 作,有時(shí)候求助百度翻譯、 有道翻譯等免費(fèi)的機(jī)器翻譯系統(tǒng)來解決問題, 但是對于一些涉及 我們商業(yè)機(jī)密的數(shù)據(jù), 由于擔(dān)心泄密, 只能借助于有道詞典查查詞, 然后再自己形成翻譯結(jié) 果。很早之前我就想,要是能有自己的機(jī)器翻譯系統(tǒng)就好了。我心目中的翻譯技術(shù)大牛、對外經(jīng)貿(mào)大學(xué)的崔啟亮老師曾在微博中給 MTI 的學(xué)生提建 議,“學(xué)好翻譯技術(shù),有前途。對于仍在

2、迷茫MTI 的同學(xué),我建議學(xué)機(jī)器翻譯設(shè)計(jì)與開發(fā),走出迷茫。 ”非常非常幸運(yùn)的是,我一個(gè)東大畢業(yè)的同學(xué)告訴我, 東北大學(xué)自然語言處理實(shí) 驗(yàn)室(國內(nèi)搞機(jī)器翻譯最好的團(tuán)隊(duì)之一) 聯(lián)合沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司推出了 “小牛翻譯 開源社區(qū)” ,社區(qū)中有一項(xiàng)內(nèi)容,就是教不懂機(jī)器翻譯的人學(xué)習(xí)“快速 搭建自己的機(jī)器翻譯 系統(tǒng)”。 于是,我走進(jìn)社區(qū),按照社區(qū)里的相關(guān)說明,親身體驗(yàn)了搭建過程。下面,我想談 談這個(gè)被譽(yù)為“目前國內(nèi)首個(gè)以機(jī)器翻譯為核心的交流平臺(tái)”的菜鳥級(jí)用戶體驗(yàn)。小牛翻譯開源社區(qū)里提供了 統(tǒng)計(jì)機(jī)器翻譯開源系統(tǒng)的全部代碼。我了解了一下, NiuTrans 開源系統(tǒng)在國際上比較有名,據(jù)說是目前國際上能夠

3、支持統(tǒng)計(jì)機(jī)器翻譯模型最全 的兩套統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)之一 ( 另一套是愛丁堡大學(xué)的 Moses) 。這些內(nèi)容對 MT(機(jī)器翻譯 ) 的專業(yè)學(xué)者應(yīng)該很有用吧, 但是對于我這個(gè)非科班出身的人來說, 其實(shí)會(huì)完全忽略這部分內(nèi) 容。我還是講講我在社區(qū)里的真正收獲快速搭建實(shí)用的機(jī)器翻譯系統(tǒng)。一、搭建過程詳細(xì)說明需要說明的是, 我是在在網(wǎng)頁指導(dǎo)與人工指導(dǎo)下才在自己的電腦 ( Windows7 64 位系統(tǒng), 硬盤 500G,內(nèi)存 8G)上成功搭建機(jī)器翻譯系統(tǒng)的。解釋一下為什么我不僅看了網(wǎng)頁上操作 指導(dǎo),還需要人工指導(dǎo)。身為“技術(shù)小白”的我,雖然網(wǎng)頁上的操作指導(dǎo)寫的很規(guī)范,但是 第一次接觸這么“高大上”的東西,還

4、是有點(diǎn)小緊張的。于是,我加入了小牛翻譯開源社區(qū) 的 QQ群(群號(hào) 8 ),聯(lián)系了群主,群主很熱心的幫我講解,在服務(wù)方面我的用戶體驗(yàn)很好。 下面我就與大家分享我如何一步步完成在自己電腦上搭建機(jī)器翻譯系統(tǒng)的。第一步,進(jìn)入“小牛翻譯開源社區(qū)”網(wǎng)站(),接著進(jìn)入“搭建MT系統(tǒng)”界面。如圖:第二步,根據(jù)自己電腦的操作系統(tǒng)( Windows系統(tǒng)還是 Linux 系統(tǒng)),選擇 合適的“ NiuTrans Server 工具包”(之所以叫 NiuTrans Server ,據(jù)說是因?yàn)?這個(gè)工具包是針對單服務(wù)器的, 或者說,這個(gè)工具包還不能用于搭建機(jī)器翻譯云平臺(tái))。小牛翻譯開源社區(qū)的群主告訴我,目前正式運(yùn)行的機(jī)

5、器翻譯系統(tǒng),都是 在 Linux 操作系統(tǒng)下安裝的, 但 Linux 系統(tǒng)下沒有圖形界面, 需要用戶稍微懂一 些代碼。為了方便像我這樣的用戶, 他們很貼心地研發(fā)出 Windows系統(tǒng)下如何搭 建機(jī)器翻譯系統(tǒng)的方法(此處值得為他們點(diǎn)贊哦)。第三步,點(diǎn)擊“ Windows版搭建教程,下載“ NiuTrans Server 工具包”。 根據(jù)語言方向和電腦內(nèi)存的大小, 社區(qū)里提供了四個(gè)工具包。 由于我的電腦內(nèi)存 總共只有 8G,所以選擇的是“中譯英 Windows4G版”。點(diǎn)擊下載即可。第四步,安裝 perl 。我是在人工指導(dǎo)下完成的,一共需要四步操作才能完 成。首先,點(diǎn)擊上面網(wǎng)頁中“運(yùn)行環(huán)境準(zhǔn)備”項(xiàng)

6、中的“ Perl 下載地址”。如下 圖:Step 1、進(jìn)入“ Perl-download ”頁面,點(diǎn)擊“ Windows”圖標(biāo)。 Step 2、點(diǎn) 擊頁面中“ DOWNLOAD ACTIVEP”ER,L即頁面上 Windows下右面第一個(gè)圖標(biāo)。大 家可以看一下左側(cè)的英文說明,除了 64位操作系統(tǒng), 32 位操作系統(tǒng)也可以支持 的。Step 3、 在新 的頁面中,點(diǎn)擊“ Download ActivePerl forWindows (64-bit,x64) ”(我的電腦是 64 位系統(tǒng))。Step 4、在新的頁面中,會(huì)自動(dòng)彈出一個(gè)下載框。經(jīng)過以上操作就可以成功 下載 Perl 。第五步,做了以上

7、準(zhǔn)備工作后,接下來進(jìn)入搭建步驟。搭建共分兩步,Step 1 、解壓工具包。找到剛剛下載的工具壓縮包, windows 7 系統(tǒng)可直 接右鍵解壓到“當(dāng)前文件夾”,解壓后的文件夾名稱為“。打開文件夾如下圖:Step 2 、啟動(dòng)機(jī)器翻譯系統(tǒng)。點(diǎn)擊上圖文件夾中 “service ”文 件夾,進(jìn)入 文件夾內(nèi),找到“( BAT 腳本文件)”,雙擊該文件即實(shí)現(xiàn)啟動(dòng)機(jī)器翻譯系統(tǒng)。如 圖:第六步,搭建操作全部完成后, 頁面會(huì)出現(xiàn)下列提示即代表啟動(dòng)成功。 下圖 是社區(qū)指導(dǎo)步驟中給的樣圖。其實(shí)操作者只要看最后一句“ Server startup in XXX ms”即可,代表專屬于你的機(jī)器翻譯系統(tǒng)已經(jīng)搭建成功,此處

8、特別提 醒,該頁面不可以關(guān)閉, 要想運(yùn)行機(jī)器翻譯系統(tǒng), 要保持著該頁面一直打開狀態(tài)。第七步,將該“ 網(wǎng)址粘貼到瀏覽器中,即可彈出如下圖頁面:然后嘛,就可以開始使用機(jī)器翻譯系統(tǒng)了!以上就完成在自己電腦中搭建機(jī)器翻譯系統(tǒng)的全過程。 在“指導(dǎo)搭建機(jī)器翻 譯系統(tǒng)”頁面中還介紹了很多小牛翻譯系統(tǒng)的其他功能。 如翻譯 API 功能、利用 自有數(shù)據(jù)訓(xùn)練翻譯模型等, 經(jīng)過好一頓的研究, 被社區(qū)群主告知這些功能都是為 機(jī)器翻譯專業(yè)人士準(zhǔn)備的,不懂程序的人無法直接使用。特此提醒其他使用者, 完成我上述七步操作, 專屬于你的機(jī)器翻譯系統(tǒng)就搭建成功了, 其他的小牛翻譯 系統(tǒng)各種功能就只能根據(jù)使用者自身的能力來選擇使用

9、了。二、對小牛開源社區(qū)的建議社區(qū)內(nèi)搭建機(jī)器翻譯系統(tǒng)的方法實(shí)現(xiàn)起來真的很便捷, 但是對搭建過程中的 某些技術(shù)指導(dǎo)表述不夠清晰,建議以下部分應(yīng)該有改進(jìn)。1)安裝 perl 環(huán)節(jié)應(yīng)該添加詳細(xì)介紹。 在上一部分我的搭建過程中, 我詳細(xì)了介 紹了安裝 perl 的步驟。安裝 perl 的網(wǎng)頁是全英文版,由于我是翻譯碩士所 以我讀起來較輕松,但是對于英語水平不太高的使用者,閱讀起來會(huì)比較困 難,這會(huì)導(dǎo)致此部分的操作有一定難度。希望社區(qū)開發(fā)者會(huì)進(jìn)一步詳細(xì)介紹 一下如何選擇各個(gè)步驟的下載選項(xiàng)。2)“代表啟動(dòng)成功”的展示圖片需修改。應(yīng)提示,操作者只要看最后一句 “Serverstartup inXXX ms”即

10、可,這就代表專屬于你的機(jī)器翻譯系統(tǒng)已經(jīng)搭建成功, 亦在圖片中明顯標(biāo)畫出來, 讓操作者可以非常清晰操作思路。 如下圖:3)截下圖,只想表達(dá),下圖的解釋說明雖然可以看得懂,但是卻不清晰,典型 的程序猿表達(dá)方式。如果想要提升用戶體驗(yàn),某些表達(dá)也可以優(yōu)化一下。我相信,隨著大家對機(jī)器翻譯的需求逐漸興起以及對數(shù)據(jù)翻譯安全的考慮, 這種 可以在自己電腦上搭建機(jī)器翻譯系統(tǒng)會(huì)有越來越多的需求。因此,“詳細(xì)、 直白、清晰、簡潔”的搭建過程說明是很有必要的。三、搭建體會(huì)作為一名不懂計(jì)算機(jī)編程、 機(jī)器翻譯技術(shù)基礎(chǔ)的我, 竟然可以實(shí)現(xiàn)自己動(dòng)手 搭建機(jī)器翻譯系統(tǒng), 我都被自己嚇到了, 應(yīng)該說小牛翻譯開源社區(qū)給了我很大驚 喜。通過自己親手搭建機(jī)器翻譯系統(tǒng), 雖然我還是不懂機(jī)器翻譯技術(shù), 但是在使 用上,感受到了機(jī)器翻譯的更多優(yōu)勢。 比如,在自己的電腦上搭建機(jī)器翻譯系統(tǒng), 使用的穩(wěn)定性、數(shù)據(jù)的安全性均可得到保障。隨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論