楊百翰大學BNC語料庫使用說明ppt課件_第1頁
楊百翰大學BNC語料庫使用說明ppt課件_第2頁
楊百翰大學BNC語料庫使用說明ppt課件_第3頁
楊百翰大學BNC語料庫使用說明ppt課件_第4頁
楊百翰大學BNC語料庫使用說明ppt課件_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、BNC語料庫使用說明1;.2楊百翰大學BNC語料庫簡介 1. 簡介1.1 通過這個網(wǎng)址,可以搜索到100 million詞的British National Corpus (1970s-1993). (當然現(xiàn)在Corpus of Contemporary American English(1990-2009)能在線免費提供 400+ million 詞,在線網(wǎng)址為:)34選擇學習BYU-BNC的原因1. BYU-BNCm免費且在線方便2. BYU 還有另外兩個語料庫TIME Corpus of American English 和Corpus of Contemporary American

2、English (COCA) ,它們的使用方法基本相同51.2 BYUBNC界面簡介62. 主要搜索功能2.1 搜索搜索words、phrases、lemmas、wildcards和其他更加復雜的字詞和其他更加復雜的字詞2.1.1 輸入單詞“mysterious” (圖2.1.1-1):得到相關結果(圖2.1.1-2):在各子庫中的頻率,每百萬詞使用的頻率若對圖2中的相應條塊進行點擊,那么就可以看到KWIC,如圖2.1.1-3 (以點Fiction的條塊為例):7圖2.1.1-18圖2.1.1-1使用CHART顯示9圖2.1.1-3 使用KWIC顯示方式102.1.2 輸入詞組輸入詞組“whi

3、te+名詞名詞” (圖2.1.2-1) 得到的結果都是white后面跟的名詞短語 (圖2.1.2-2),檢索表達式為:white n*11圖2.1.2-1 規(guī)則:輸入名詞的話用正則表達式: n*;動詞: v*; 形容詞: aj*; 副詞: av*12圖2.1.2-2 White+名詞的短語132.1.3 輸入通配符輸入通配符(wildcards),如分別輸入un*ly和r?n*,結果如圖2.1.3-1和.2.1.3-214圖2.1.3-1 15圖2.1.3-2 162.1.4 輸入輸入lemma(即一個單詞的單復數(shù)單復數(shù)、時態(tài)時態(tài)等所有形式),若要得到sing這個單詞的所有形式,可以如下圖所示

4、(圖2.1.4-1) 17圖2.1.4-1規(guī)則:若要得到某個單詞的所有單復數(shù)和時態(tài)形式,那么就要在輸入時,在這個單詞外加 。18圖2.1.4-2形容詞early的圓形,比較級和最高級三種形式一次性檢索出來檢索192.1.5 輸入某種詞性且部分帶有某些字母的命令輸入某種詞性且部分帶有某些字母的命令,如要得到以un-開頭、-ed結尾的所有形容詞的所有形式(見圖2.1.5-1)和得到動詞+任何詞+ground的所有詞組(見圖2.1.5-2):規(guī)則:若要得到某種詞性且詞中帶有部分帶有某些字母的形式時,如要得到以un-開頭、-ed結尾的所有形容詞的所有形式,那么輸入: un*ed.aj*;若要得到動詞+

5、任何詞+ground的所有詞組,那么輸入: vv*ground即可。前者用來研究詞匯,后者用來查詢特定詞性的搭配。20圖2.1.5-1 21圖2.1.5-2 動詞+任何詞+ground的所有詞組222.2 搜索搭配詞和出現(xiàn)的頻率搜索搭配詞和出現(xiàn)的頻率如 “thick后跟的名詞” (圖2.2-1)23圖2.2-1 規(guī)則規(guī)則:在context里輸入n* 后選擇4,表示在thic4后面(4跨距范圍內)出現(xiàn)的任何名詞24如跟在 “smile前面的形容詞” (圖2.2-2)規(guī)則:在words里輸入: smile.n*,表示作為名詞的smile; 在context里輸入: aj*表示其前后出現(xiàn)形容詞的語境

6、。25Confidence前使用的行用詞 圖2.2-3262.3 搜索在子語料庫搜索在子語料庫(register)內內(或之間或之間)出現(xiàn)的頻率出現(xiàn)的頻率(或比較或比較)(不同語域中的不同語域中的用法用法)如在Fiction和Newspaper子數(shù)據(jù)庫中passionate后面可以跟任何名詞的詞及頻率,分別如兩圖(2.3-1和2.3-2)27圖2.3-1 圖2.3-2 28但是也可以之間對兩者子語料庫中它們出現(xiàn)頻率的對比,操作:分別選擇section 1&2,如下圖(圖2.3-3): 29圖2.3-3 302.4 進行語義傾向比較進行語義傾向比較2.4.1 比較近義詞如:近義形容詞hot和wa

7、rm后面所跟名詞的區(qū)別(如圖2.4.1):31圖2.4.1 規(guī)則:在words的方格里分別輸入hot和warm,再在context方框里輸入nn*,表示后面所跟任何名詞。當然也可以比較在某個子語料庫中出現(xiàn)的頻率比較。 3233342.4.2 比較反義詞如:woman和man前面所跟的形容詞的區(qū)別(如圖2.4.2)圖2.4.2 規(guī)則:在words的方格里分別輸入woman和man,再在context方框里輸入aj*,選在左3,表示前面3個跨距內所有的形容詞。當然也可以比較在某個子語料庫中出現(xiàn)的頻率比較。352.4.3 搜索近義詞搜索近義詞如:搜索beautiful的所有近義詞(如圖2.4.3-1)規(guī)則:在words的方格里輸入=beautiful,表示和beautiful語義相近的所有形容詞。36再如:搜索動詞clean的所有近義詞,如下圖:圖2.4.3-2 37當然可以進一步搜索與clean語義相近的動詞+the+名詞的詞組,=clean.v* the n* 如下圖:圖2.4.3-3 38394041BYU-BNC詞性附碼的使用1)查詢多義詞特定的詞性,如for2)某個詞前/或者后面特定詞性的若干搭配詞, 如confidence 前的形容

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論