200619100339張欣怡外文翻譯.doc_第1頁
200619100339張欣怡外文翻譯.doc_第2頁
200619100339張欣怡外文翻譯.doc_第3頁
200619100339張欣怡外文翻譯.doc_第4頁
200619100339張欣怡外文翻譯.doc_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Lexicographers Dreams in the Eectronic-Dctionary Age作者:Gilles-Maurice de Schryver來自:International Journal of Lexicography 2003 Vol.16, No.2: 143199翻譯內(nèi)容:Chapter 3 & 43電子詞典理論“毋庸置疑很多原始的理論是想象得到的,如電子詞典理論是基于詞典的功能或獲取信息組織地址的類型”。眾所周知任何參考著作的理論很大程度上是不固定的,對于電子詞典也不例外。在20世紀90年代,一些電子詞典理論的簡要概述已經(jīng)被提出,它們將按時間順序被介紹,每一個介紹之后都會有我們的建議。在20世紀90年代開始,Martin (1992: 1934)在辭書學領(lǐng)域觀察一下他稱之的“對象”:(1)人類用戶的詞典,(2)基于計算機的詞典,(3)機器可讀詞典,(4)詞典庫/術(shù)語庫,(5)機器字典,(6)詞典數(shù)據(jù)庫,(7)人工智能詞庫。正如人們可以看到的,沒有試圖區(qū)分計算機和非計算機的“對象”。一點也不要感到驚訝電子詞典最先在遠東地區(qū)流行,最早的專業(yè)的電子詞典理論也是在這各地區(qū)發(fā)展起來。Ide的理論立足于硬件和軟件的不同,而且僅專注于電子雙語詞典(EBDs)。Ide分為:(1)特定的電子雙語詞典(EBDs),(2)電子筆記本,(3)光盤的電子雙語詞典(EBDs),(4)電子詞典(ED)軟件。這個理論僅僅基于硬件和軟件似乎不是非常有效,因為它需要連續(xù)的調(diào)整來迎合永無止盡的創(chuàng)新。事實上兩年以后,Sharpe (1995: 41)已經(jīng)在Ide關(guān)于電子雙語詞典(EBDs)的四種分類種增加了兩種其他的電子雙語詞典(EBDs)類型:(5)基于便攜式軟盤的電子雙語詞典(EBDs),(6)在手提式光學字符識別(OCR)掃描儀。一年以后,來自Lehr的一個更有說服力的兩步技術(shù)(元)辭書學的電子詞典(ED)理論如圖1。在第一部中,電子詞典根據(jù)技術(shù)背景主要分為在線和單機詞典,單機詞典又分為掌上電子詞典(PEDs)和電腦詞典,電腦詞典再分為光盤、軟盤和其他詞典。在第二步中,每一個電子詞典(ED)按(元)辭書學的內(nèi)容分類。不是基于紙質(zhì)詞典的電子詞典(ED)就是新發(fā)展,它們分別又可進一步分類則有輸出格式(如在屏幕上顯示的電子詞典看起來像紙質(zhì)詞典的版面)或新外觀(如電子詞典不模仿紙質(zhì)字典的排版)。電子詞典脫機詞典在線詞典掌上電子詞典(PED)電腦詞典光盤軟盤其他基于紙質(zhì)字典新發(fā)展輸出格式新外觀技術(shù)評價元辭書學評價圖表 1:兩步技術(shù) (元)辭書學電子詞典理論在最近的理論中都是支持Nesi的理論。根據(jù)她的理論,20世紀90年代見證一種為了語言學習的電子詞典的產(chǎn)生和發(fā)展。關(guān)于這四種類型的數(shù)據(jù)在表1中列出。雖然在表1 中的區(qū)別在十年前可能是合情合理的,但是Nesi也公正地指出它們現(xiàn)在看來是模糊的,如高度創(chuàng)新詞典正在往互聯(lián)網(wǎng)發(fā)展(一些詞典只能被它們的訂閱者訪問),在線課件越來越商業(yè)化還可以刻錄到光盤上,光盤詞典被放置在互聯(lián)網(wǎng)上,掌上電子詞典(PED)開始受到更嚴格的詞典編撰的考慮。表格 1:電子時代的詞典理論#類型資源誰收益1因特網(wǎng)詞典(過時)免費版權(quán)資料和用戶共享網(wǎng)民2在線課件的詞匯表新資料在大學里的語言系工作人員3光盤學習詞典較好的硬拷貝參考書主要的詞典出版社4掌上電子詞典沒有命名(硬拷貝)資源電子產(chǎn)品制造商通過這個簡要概述,很明顯沒有一個現(xiàn)有的電子詞典理論是完全令人滿意并且涵蓋現(xiàn)今的所有類型的電子詞典。因此我們建議理論基于一個主要的、嚴格的標準:一個詞典訪問的方式。特別是在設計這個理論時,我們考慮到一個問題:“誰訪問什么、訪問哪里?”因而發(fā)生的三步理論是被認為足夠靈活去迎合未來新發(fā)明。在三步訪問理論中,第一步解答了問題“誰訪問詞典?”這里有兩種可能:它是機器或者人類。機器可以訪問自然語言處理詞庫,人類可以訪問人類可讀詞典,雖然機器和人類都可以訪問那些設計自然語言處理和人類使用的詞庫。對于第二步,我們需要回答“訪問什么?”舉例來說就是我們查找詞典媒體。其中物理對象(如非電子)媒體和電子媒體是不同的。這些媒體具體分為手持設備和耐用機器。現(xiàn)在討論中心是電子詞典媒體。通過在第二章的概述,以人為本的電子詞典容易地使用人類可讀數(shù)據(jù)庫-允許增加自然語言處理軟件(如形態(tài)學的分析儀),自然語言處理詞庫有自己的規(guī)則(如拼寫檢查)或設計自然語言處理和人類使用的數(shù)據(jù)庫(如WordNet 和 FrameNet)。物理對象媒體包括人類可讀詞典和設計自然語言處理和人類使用詞庫的印刷渲染。最后,第二種印刷渲染的電子數(shù)據(jù)和自然語言處理詞庫適合于大規(guī)模工作的自然語言處理系統(tǒng)(不是本文的主題)。在圖2中的最高兩層顯示到目前為止理論的第一、二步。如果第一、二步相當?shù)暮唵?,他們就需要設置第三步的場景?;卮饐栴}“訪問哪里(的詞典數(shù)據(jù))?”,它也被視為對存儲類型(或在電腦硬件方面)的調(diào)查。為了對比原因,我們從物理對象媒體的存儲類型開始。這個分類維持最小量,我們只歷時地考慮一些存儲類型。就手持設備而言,我們列舉泥板、木蠟板、紙莎草紙、羊皮紙以及打印界面。在這片文章中,打印界面被稱為所謂的傳統(tǒng)“紙質(zhì)字典”。為了保存特別是早期存儲類型的數(shù)據(jù),數(shù)據(jù)將被拍照然后通過微縮膠片存儲。堅固的機器要求讀取多個來自原稿的微圖像。回到電子詞典,手持設備和耐用機器都可以進一步細分順著單機和網(wǎng)絡這條線分類。手持單機詞典實例有掌上電子詞典、錄音筆、在移動電話里支持文本信息的詞庫?,F(xiàn)在手持網(wǎng)絡詞典幾乎沒有太多的實例,當前已經(jīng)有一些移動電子組織者在技術(shù)發(fā)達的國家推廣和提供訪問一些在線詞典。如今最流行的耐用電子機器是臺式和便攜式電腦。在單機版本中,詞典存儲在不同類型的磁盤上(光盤、DVD、硬盤等),而在網(wǎng)絡版本中硬盤是主要的存儲設備。在網(wǎng)絡版本中需要區(qū)分只能進入本地局域網(wǎng)絡和內(nèi)網(wǎng),以這種方式存儲的詞典和可以進入萬維網(wǎng),因而存儲在服務器上利用互聯(lián)網(wǎng)的詞典。伴隨著當今的創(chuàng)新技術(shù)步伐,通過手持設備和無線電設備廣泛和普遍地訪問國際互聯(lián)網(wǎng)成為可能。當那一天來臨,通過這種方式進入的詞典作為混合體能夠結(jié)合大部分掌上電子詞典和因特網(wǎng)詞典的優(yōu)點。如今很多內(nèi)網(wǎng)電腦也能連接國際互聯(lián)網(wǎng),以及越來越多的家庭電腦用戶可以登錄國際互聯(lián)網(wǎng)。在這種環(huán)境中,內(nèi)網(wǎng)或光盤詞典的優(yōu)點可以和網(wǎng)絡詞典的優(yōu)點結(jié)合。為了盡可能接近現(xiàn)在的平均水平,在市場沒有準備好的情況下,我們將不混合各種類型。我們因此在表2中集中力矩了電子詞典類型。表2中最后一排回答了問題“誰訪問什么,訪問哪里?”圖表 2:三步訪問字典技術(shù)字典(Ds)自然語言處理詞庫人類可讀字典自然語言處理和人類可讀的詞庫物理對象詞典以人為本電子詞典純自然語言處理系統(tǒng)手持設備字典耐用機器字典手持設備字典耐用機器字典泥板紙微縮膠片脫機字典在線詞典脫機字典在線詞典掌上電子詞典、錄音筆移動磁盤光盤硬盤內(nèi)網(wǎng)詞典因特網(wǎng)詞典本地磁盤萬維網(wǎng)磁盤誰訪問訪問什么訪問哪里表格 2:當今紙質(zhì)詞典和電子詞典的情況電子詞典(ED)脫機電子詞典網(wǎng)絡電子詞典傳統(tǒng)紙質(zhì)詞典手持詞典(如:掌上電子詞典)耐用機器詞典(如:光盤)內(nèi)網(wǎng)詞典因特網(wǎng)詞典用戶使用手持書籍去查找印刷在紙上字母D的信息用戶使用掌上電腦去訪問儲存在小型磁盤上字母D的信息用戶使用便攜式或臺式電腦去訪問儲存在大型磁盤上字母D的信息一組用戶使用便攜式或臺式電腦去訪問儲存在本地主機上字母D的信息世界范圍的用戶使用便攜式或臺式電腦去訪問儲存在在線服務器上字母D的信息4. 紙質(zhì)字典和電子詞典的優(yōu)缺點Sharpe說:“我的觀點是電子詞典的優(yōu)勢和如今年輕人對電子設備的熟悉將使印刷字典這一概念降到次要的地位?!痹陉P(guān)于電子詞典的學術(shù)文獻中,電子詞典最常見的設置最可能是advantage,這種advantage認為是相對于紙質(zhì)字典。我們顯然完全支持這個觀點,也想給這兩種類型公平的待遇。因此在這一章中我們將討論:(1)致力于這兩種類型的優(yōu)點用“”標記,而缺點用“-”;(2)評分優(yōu)點使用星號“*/*/*”(越多的星號代表從文獻中收集到越多肯定的反饋);(3)嘗試思考“類似方面”,同時脫離以后部分的設想。在表2中列出了5中詞典類型,我將安排討論這個優(yōu)點按紙質(zhì)、掌上電子詞典、光盤、INTRA to INTER這個順序逐步介紹。在表中將伴隨這種討論,以及一個關(guān)于文獻的選擇。4.1不可替代的紙質(zhì)詞典在表3中列出了傳統(tǒng)紙質(zhì)字典的一些方面直至今天仍然是不能被超越。盡管Sharpe的觀點是最終使印刷字典這一概念降到次要的地位,紙質(zhì)字典到目前為止仍然是最常見的產(chǎn)品(#1)。它們具有象征價值在語言的重點以一種可觸及的方式,而一本書或者一系列書可以在圖書館借到(#2)。查閱電子詞典也依然情切友好:他們?nèi)菀捉栝啠梢哉嬲p松的閱讀,在自然的方式下顯示視角,提供方便的物理操作,不用迫使眼睛盯著電腦顯示器(#3-4)。紙質(zhì)字典也允許用戶在字典中手動注釋或者劃出特殊信息(#5)。最終紙質(zhì)詞典是最耐用,相對獨立存在(盡管電子詞典數(shù)據(jù)的傳輸和界面已經(jīng)不用了),不需要打開電腦(#6-8)。后者聽起來可能有些瑣碎,但在世界很多地方這仍舊是關(guān)鍵因素。表格 3:紙質(zhì)詞典優(yōu)勢#優(yōu)點紙質(zhì)掌上電子詞典光盤內(nèi)網(wǎng)詞典因特網(wǎng)詞典1常見的、可靠的-2作為實物具有象征價值,可以擁有-3容易借閱,可以輕松的閱讀,容易瀏覽全文-4容易閱讀,對眼睛傷害小-5容易注釋,可以直接用筆寫在上面-6持久耐用,可以攜帶到任何地方不用擔心嚴重破壞或者功能丟失-7獨立存在(不被插入任何東西;也沒有東西插入)-8不要求電腦保持開機-4.2手持設備在第二部分,我們將看紙質(zhì)詞典的幾個方面仍然有得到較高評價相比于掌上電子詞典。掌上詞典是手持詞典的代表。表4總結(jié)了它們的優(yōu)點。紙質(zhì)字典和掌上電子詞典都便于攜帶和購買后可以在任何地方直接使用(#9-11)。不過掌上電子詞典并不是與網(wǎng)站無關(guān)的紙質(zhì)字典,多卷或者大規(guī)模的詞典顯然不如掌上電子詞典便于攜帶。(該區(qū)別用不同星號評定等級來說明。)另一個紙質(zhì)字典和掌上電子詞典的優(yōu)點是事實上它們可以脫機訪問,類似于共享在磁盤上的脫機詞典(#12)。最終紙質(zhì)詞典相對于電子產(chǎn)品時效率低的,盡管掌上電子詞典通常認為只是小工具或是地位象征(#13)。觀察得出被認為是地位象征的小工具增加使用過程中的動力所以該產(chǎn)品面向富有的購買者,實際上掌上電子詞典是經(jīng)常使用。根據(jù)Landau的觀點,掌上電子詞典已經(jīng)影響雙語詞典市場。表格 4:手持設備詞典優(yōu)勢#優(yōu)點紙質(zhì)掌上電子詞典光盤內(nèi)網(wǎng)詞典因特網(wǎng)詞典9在獲得后可以隨時使用(如:沒有再次購買和不需要臺式/便攜式電腦)-10可以在任何地方使用,不依賴網(wǎng)站*-11輕便、尺寸小、重量輕*-12離線訪問(如:詞典需要和內(nèi)網(wǎng)或因特網(wǎng)鏈接)-13低性能的產(chǎn)品(如:不能看見小器具或狀態(tài)符號)*-*4.3.本地磁盤設備在20世紀80年代末,在一段時間小工具掌上電子詞典已經(jīng)流通,第一代詞典中有光盤。隨著光盤出現(xiàn),打破了早期電子產(chǎn)品的硬件空間限制,一方面這個趨勢延續(xù)到現(xiàn)在的DVD技術(shù),另一方面越來越大的硬盤容量使數(shù)據(jù)容易從光盤傳輸?shù)诫娔X銀盤。當今,這一類磁盤在不同詞典中最突出的優(yōu)勢在表5中列出。相比于紙質(zhì)詞典,存儲在光盤上的詞典占用很小的物理空間(#15)。如師,中國人經(jīng)常在著作中提及用于表示對某人非常尊敬就把他們認為是老師。如今由于電子媒體,他們最終可以說話。各種各樣有用的應用軟件(確實加入文件部分)已經(jīng)被運用如發(fā)音、一個聲音范圍文件和錄音比較設備(#14,#16)?;诒镜卮疟P的詞典最令人驚訝的特點是可以迅速的查找到(在多媒體庫里的)數(shù)據(jù)(#17)。新的技術(shù)也是一種新的方法去顯示數(shù)據(jù),如計算機圖形學(#18)。一些技術(shù)是出眾的,如Corris et al.所提出的技術(shù)“彩色的網(wǎng)絡增加相關(guān)文字的描述”然而其他則是完全誤導,如“顯示發(fā)音波形圖”(在有說服力的評論中,Sobkowiak說明就算是原始的錄音反饋的結(jié)果也不是相同的圖形)。一些情況下在電子詞典中有可能有不同的查詢路線(模糊查找、超鏈接等),電子詞典使這種媒體真實存在(#19)。然而其他人對“靈活性”(用戶定制、互動、用戶界面友好等),“靈活性”被認為是電子詞典的最有吸引力的方面(#20-21)。最終,電子詞典增加了復制粘貼工具(#22)。對每一個討論的電子詞典優(yōu)點,網(wǎng)絡應用遲于本地磁盤。表格 5:本地磁盤詞典優(yōu)勢#優(yōu)點紙質(zhì)掌上電子詞典光盤內(nèi)網(wǎng)詞典因特網(wǎng)詞典14發(fā)聲發(fā)音可用性和聲音文件-*15詞典花費很少空間和有一個非常低比重-*N.A.N.A.16記錄自己的設施(如比較儲存的發(fā)音和自己的發(fā)音)-*17快速訪問詞典數(shù)據(jù)-*18提供信息的兩種方式(如:計算機圖形學)-*19模糊搜索設備,多存取,查詢路徑的范圍,超參考-*20(大規(guī)模)用戶定制;互相作用-*21非常友好的用戶界面-*22復制-粘貼設備-*4.4. 電子設備到目前為止在表中電子詞典優(yōu)點明顯。如果認為電子詞典是一個整體,記錄一些關(guān)于紙質(zhì)詞典共享優(yōu)點。這些內(nèi)容將在表6中列出。許多創(chuàng)始者,特別是在掌上電子詞典領(lǐng)域的一些著作,強調(diào)新奇的事物導致日益增加的積極性,實際上增加了查閱電子詞典(#23)。值得注意的是這個優(yōu)點正是表3中列出的#1優(yōu)點相反。進入電子化也意味著減少辦公室紙張(#24)。但是真正電子詞典變革的核心在于用戶不再局限于字母順序的排列,超文本、菜單等消除了(人為的)連接文本的限制,數(shù)據(jù)顯示在屏幕上不是靜止的,強大的搜索能力總體保證了穩(wěn)定的瀏覽。表格 6:電子詞典優(yōu)勢#優(yōu)點紙質(zhì)掌上電子詞典光盤內(nèi)網(wǎng)詞典因特網(wǎng)詞典23新穎的吸引力-24在辦公室減少紙張,生態(tài)無害-25用戶從字母順序中解放-26消除線性文本的限制;不是每一件事情都要記錄/可見和連續(xù)-27交叉引用的最優(yōu)化(如:避免必須查找兩個條目,如果第一個必須是交叉引用)-4.5在線設備從網(wǎng)絡詞典考慮,顯然在許多方面都毫無疑問有優(yōu)勢。這些優(yōu)勢將在表7中列出。從紙質(zhì)詞典到電子詞典提供在公共領(lǐng)域聯(lián)機像因特網(wǎng),其中值得注意的是日益增加的存儲能力(#28)。一些詞典編撰者已經(jīng)開始認為因特網(wǎng)可是為一個整體類似于巨大的知識商店或巨大的百科全書。從聲音辭書學觀點來看,以上觀點是很難接受,雖然因特網(wǎng)當然是電子數(shù)據(jù)最便利的地方(容易進入,如網(wǎng)頁抓取),也容易連接成上百個專用的組織(#29)。但是問題依然存在,是否普通用戶能處理原始數(shù)據(jù)然后轉(zhuǎn)換成辭書學的聲音信息。后來出現(xiàn)一個類似的問題是“一站式咨詢”,它是同時共享幾百本電子詞典因特網(wǎng)站。所有搜索數(shù)據(jù)顯示成一個長列表,產(chǎn)生最值得信賴的資料來源和完全外行的混合物(#34)。雖然是技術(shù)層面,但對高級用戶使用更方便。另外逐漸減小對存儲空間的約束增加了新的信息類型如視頻序列或者動畫(#30-31)。另一個在線詞典積極的因素(于脫機、磁盤詞典相比,不是掌上電子詞典)是它們大范圍與其他軟件鏈接(#32)。這種可能性是在計算機輔助語言學習開發(fā)最成功。Lingware 如果要說在線詞典最突出的優(yōu)點,那一定是詞典永遠不會過時,就像是一個最大的動態(tài)知識儲存室(#33)。20年前,研究者Arnold 和Kay預言詞典將不再是產(chǎn)品,而是開始提供一個面向用戶的在線服務器。Dodd認為,在線詞典有優(yōu)勢,但印刷字典價格是固定的不管使用次數(shù),而在線詞典可能每查閱一次就要收費(#35)。最終,因特網(wǎng)詞典只能向大部分用戶提供免費的信息,而一些優(yōu)秀的詞典事實上是不能再因特網(wǎng)上找到(#36)。Landau正確地指出“在大多數(shù)情況下,可接近性會限制查閱特定單詞。這種訪問方式是一個銷售工具而不是一個信息服務器,故意讓用戶去買書、CD或以電子方式獲得在因特網(wǎng)的權(quán)限。”表格 7:在線詞典優(yōu)勢#優(yōu)點紙質(zhì)掌上電子詞典光盤內(nèi)網(wǎng)詞典因特網(wǎng)詞典28沒有空間限制其他以及避免限制用戶,大量數(shù)據(jù)質(zhì)量-*29快速在語料庫訪問大量詞庫的證據(jù)-*30新信息類型-*31視頻序列,動畫-*32鏈接(其他)軟件(如:嵌入在教學/學習游戲等)-33更新;動態(tài)知識庫-34一站式查閱(如:數(shù)百個母語和雙語詞典的同步搜索)-35查閱花費取決于實際使用情況-36如果在不是免費情況下,也非常便宜-4.6.詞典編撰者、研究者和出版商的收益到目前為止,我們已經(jīng)從用戶角度討論了不同詞典類型優(yōu)點和缺點。在當今的元辭書學領(lǐng)域,這個方法是最大化實現(xiàn)用戶的期望。因此總結(jié)本節(jié),我們將簡潔列出一些詞典編撰者、研究者和出版商的收益。在表8中列出。如今因特網(wǎng)詞典如雨后春筍般迅速發(fā)展。的確出現(xiàn)了成千上百種詞典,遺憾的是大部分草率編撰的結(jié)果或者所謂“自下而上寫作編輯”的過程輸出。后者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論