語言學理論中依存樹庫的應用分析_第1頁
語言學理論中依存樹庫的應用分析_第2頁
語言學理論中依存樹庫的應用分析_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、語言學理論中依存樹庫的應用分析語言學理論中依存樹庫的應用分析前言目前在語言知識的獲得方法上已經(jīng)獲得了重大打破,即由傳統(tǒng)手工方法完成了向語料庫輔助方法的過渡,進而促進了語言知識獲得準確率和效率的提升,同時還可以將研究者的片面性和主觀性獲得,該方法使得語言學方法論和理論均獲得了很大的開展?;谟嬎銠C語言學家是提出依存樹庫者,故而在進展研究的過程中語言學理論研究著并未重視,但是隨著理解層度的加深,使得在語言學理論中依存樹庫被不斷的應用,并且也將一定的研究成果獲得。一、依存樹庫概述所謂的樹庫就是這標注了語義信息、句法、詞類的語料庫,在語言處理上存在困難和復雜性,因此,要想將語言知識獲取,就必須將標有語

2、言信息的語料庫充分應用。目前人們將樹庫作為了知識源、句法構造獲得、句法分析結果評價的主要工具,并且相關研究者對其重視度也在不斷增強。并且國外研究發(fā)現(xiàn),樹庫囊括了豐富的句法分布和詞類信息,是研究句法和詞類的重要根據(jù)。同時還可以將語言信息從樹庫中抽取,在研究語言學時將樹庫作為重要工具。目前國內(nèi)外開發(fā)了眾多樹庫,其中以PSG句法標本文由論文聯(lián)盟.Ll.搜集整理注和DG句法標注為主要的句法標注體系,其中前者建立的漢語短語構造樹庫包括了北京大學的漢語樹庫、臺灣中央研究院的漢語樹庫、清華大學的句法樹庫及其美國的賓州樹庫等。依存語法與短語構造語法比照之下,前者對于漢語句法構造的描繪更合適,這主要是因為漢語中

3、語法意義的表達主要是通過虛詞和語序表示的,并且漢語的詞間關系具有復雜性。然而依存樹庫是在依存語法的根底上標注句法體系的語料庫,在描繪句法構造時主要是通過將詞與詞之間的關系建立實現(xiàn)的。二、語言學理論研究中依存樹庫的應用1.研究語言類型學在語言學中,語言類型學屬于一門顯學,其任務是總結人類語言共性及其跨語言比擬。學者劉海濤研究了漢語句法的類型學特征與漢語依存樹庫的相關性得出,漢語中50%左右的依存關系是在不相鄰詞間發(fā)生,使句子中依存關系形成的兩個詞間平均存在著1.84個詞,換言之2.84就是漢語的平均依存間隔 。漢語屬于AdjN、V、SV型語言,還是對混合型語言。該研究結論與其他語言類型學家得出的

4、結果具有一樣性。劉明杰也研究了不同語體文本的依存樹庫,同時比照了英漢依存間隔 ,并得出,英語與漢語的依存間隔 相比,前者更小,由此可見,依存樹庫對于研究語言類型學可操作性很強,可以幫助我們對漢語句法構造的特點更好從依存句法角度理解,并對人類語言普遍性的發(fā)現(xiàn)有利。2.研究語言中的詞類高松以依存樹庫統(tǒng)計了現(xiàn)代漢語動詞、名詞、附屬詞、支配詞的依存關系類型,得出了動詞和名詞句法功能分布概率,對前人的研究結果進展了補充,同時也驗證了研究結論。袁芬瑜以依存樹庫對英語名詞的搭配進展了描繪,并且將英語名詞依存關系分析得出,同時還對英語名詞的罕見句法、主要、次要功能進展了總結。在對前人理論檢驗的同時,也將改良建

5、議提出。陳芯瑩研究了虛詞,資源選擇為漢語依存句法樹庫,將復雜網(wǎng)絡分析技術和方法運用的情況下,對漢語句法中的介詞在、動態(tài)助詞了和構造助詞的的特點進展了研究,同時對虛詞的被支配力和支配力做了計量地分析。3.研究播送電視語體語言學研究的核心領域就是語體研究,劉丙麗將實話實說、新聞聯(lián)播作為了依存樹庫,同時還自建了兩個依存樹庫,并將其作為資源,對口語體和書面語體不同句法成分的差異進展了分析,得出在口語體和書面語體中句法成分的各詞類比重差異顯著,同時還將不同語體中充當句法成分時各優(yōu)勢詞類統(tǒng)計得出。4.研究外漢語教學依存樹庫對于外漢語教學中詞匯教學具有重要的作用,通常使用頻率及其詞語搭配情況等信息與詞匯教學

6、具有親密相關性。高松的研究統(tǒng)計了偏誤頻率最高的50個錯詞,并將其根據(jù)錯誤頻率進展甲、乙、丙三級劃分,并將不同等級錯詞的配價信息在依存樹庫中提取,并將其制作為配價詞表。其研究結果顯示了在實際使用中高頻錯詞可能出現(xiàn)的所有用法和情況,同時將各個用法出現(xiàn)的頻次統(tǒng)計,實現(xiàn)了量化信息的統(tǒng)計,有助于外漢語詞匯教學。三、依存樹庫對語言學理論研究的啟示1.將依存樹庫的應用領域拓展除了將依存樹庫應用于計算語言學研究之外,還可將其在理論語言學研究中應用。依存樹庫對語言學理論研究來說,具有語言資源可靠、語言數(shù)據(jù)真實、客觀的特點。時至今日,學者將依存樹庫應用于語言學理論研究,使用的方為主要包括了對外漢語教學研究、電視節(jié)

7、目語體研究、現(xiàn)代漢語虛詞的地位研究、英語詞類句法功能的計量研究及其漢語的語言類型學研究等??梢娨来鏄鋷鞂τ诶碚撜Z言學研究具有有效性和可行性。要想將依存樹庫資源優(yōu)勢充分利用,就必須對語言知識深化挖掘,將語言現(xiàn)象發(fā)現(xiàn)更多,這樣才可以將依存樹庫的應用領域不斷拓展,并將其應用于語言學理論研究中。進而對語言計量更加深化、細致的研究,如語義、句法、現(xiàn)代漢語詞類等方面,將依存樹庫與應用研究和語言學本體研究結合,并從不同角度挖掘,同時還可以將針對性的語言研究開展。2.對依存樹庫資源優(yōu)勢予以重視基于依存樹庫得天獨厚的優(yōu)勢就是句子構造的分析和理解,依存樹庫富含豐富的語義、句法、詞類等信息,既能將中心詞信息給出,同時還能將句子中的詞間關系提供。并且還可以根據(jù)研究需求完成語義描繪。統(tǒng)計分析依存樹庫中抽取的數(shù)據(jù),就可以總結成為語言學知識,對前人的研究結論檢驗的同時,還可將語言學理論體系中的缺乏彌補,將語言現(xiàn)象發(fā)現(xiàn),將問題充分解決。當下眾多學者倡導將語言學返回計算語言學,使語言學根底問題在計算語言學研究中重現(xiàn),共享語言學資源。但是基于大局部依存樹庫的提出和構建都不是理論語言學家,因此在語言學理論中依存樹庫的應用不多,多局限于計算語言學研究中。進而導致眾多的理論語言學家對依存樹庫沒有一個正確的認知和理解,進而無視了語言學理論研究中依存樹庫的重要性。由此可見,語言學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論