非常與特別基于語料庫的研究_第1頁
非常與特別基于語料庫的研究_第2頁
非常與特別基于語料庫的研究_第3頁
非常與特別基于語料庫的研究_第4頁
非常與特別基于語料庫的研究_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

“非?!迸c“特別”

——基于語料庫的研究北京大學

外國語學院陳璐

蘇祺2013.05.11研究目的中文近義詞“非?!迸c“特別”的基本語義特征及語法功能,有共性,也有不同之處。借助計算語言學中基于語料庫的研究方法,對中文詞匯“非?!迸c“特別”進行定量考察,說明該組漢語近義詞在使用上的區(qū)別。研究對象【詞目】非?!踞屃x】

①【形容詞】異乎尋常的;特殊的:~時期ㄧ~會議。

②【副詞】十分;極:~光榮ㄧ~高興ㄧ~努力ㄧ他~會說話。

【詞目】特別【釋義】

①【形容詞】與眾不同;不普通:~的式樣ㄧ他的脾氣很~

②【副詞】格外:火車跑得~快ㄧ這個節(jié)目~吸引觀眾

③【副詞】特地:散會的時候,廠長~把他留下來研究技術(shù)上的問題

④【副詞】尤其:他喜歡旅游,~是騎自行車郊游不同語域中:詞性使用是否均衡——每個詞自身內(nèi)部功能的使用頻率。作典型程度副詞的用法:作“~+形容詞”或“~+的/地/得+形容詞”的結(jié)構(gòu)。作近義詞時的用詞搭配及互換能力。研究方法:

1、語料庫的選取和構(gòu)建(1)新聞?wù)Z料庫:北京大學計算語言學研究所構(gòu)建的“人民日報標注語料庫”。該語料庫是以1998年《人民日報》語料為對象,共計約194.5萬字。(2)小說語料庫:從網(wǎng)絡(luò)上選取點擊率較高的小說自行構(gòu)建語料庫,小說類型涵蓋古裝、玄幻、言情、兒童、現(xiàn)實等題材,共計約329萬字。(3)口語語料庫:北京語言大學語言研究所構(gòu)建的“北京口語語料庫”,包括184萬字由錄音轉(zhuǎn)寫、校對、整理后的北京口語語料?!獣嬲Z體——中間語體——口語語體研究方法:

2、數(shù)據(jù)處理(1)加工語料庫:刪減網(wǎng)頁亂碼、空格、日期、轉(zhuǎn)行等不必要的字符,并轉(zhuǎn)為txt文檔格式。(2)使用Python編寫的程序分別對各語料庫中“非?!迸c“特別”進行檢索。(3)使用中國科學院計算技術(shù)研究所研制的漢語詞法分析系統(tǒng)ICTCLAS,對第(2)步中得到的檢索結(jié)果進行中文分詞以及詞性標注。(4)利用分析軟件AntConc3.2.4的索引(Concordance)功能對處理后的文件分別進行檢索。

(5)用分析軟件AntConc3.2.4的搭配(Collocates)功能,對“非?!迸c“特別”兩個詞右邊界出現(xiàn)的詞語按照頻次、不分詞性地進行排序。

數(shù)據(jù)結(jié)果及分析討論表(一)

詞數(shù)作形容詞作副詞總頻次概率(每百萬字)總頻次概率(每百萬字)總頻次概率(每百萬字)新聞?wù)Z料庫非常24412584236121特別63032414776483248小說語料庫非常557169113534162特別31496682124675口語語料庫非常24713400238129特別2391129914076225112231、語域使用分析新聞?wù)Z料庫:人們偏好于使用“特別”,但在典型程度副詞的基本使用上卻偏好使用“非?!?;小說語料庫:偏好使用“非常”;口語語料庫:偏好使用“特別”;“非?!钡臅嬲Z體色彩較強,而“特別”的口語程度較高。表(三)

形容詞功能占總語法比例副詞功能占總語法比例程度副詞占副詞功能比例程度副詞占總語法比例新聞?wù)Z料庫非常0.0330.9670.6610.639特別0.2330.7670.0640.049小說語料庫非常0.0200.9590.6460.619特別0.2170.7830.2760.217口語語料庫非常00.9640.6640.640特別0.0590.9410.5940.5592、副詞功能分析“非常”的用法以副詞為主;副詞用法中,典型程度副詞用法占主要地位;在書面、中間以及口語語體中使用較為均衡?!疤貏e”的用法也以副詞為主,但比“非?!币?,且在各語料庫中的比例有所區(qū)分,在口語語料庫中最高。在典型程度副詞的用法上,比例也比“非常”低;用法并不均衡,但仍以副詞為主,用法最多的是“特別是”。數(shù)據(jù)結(jié)果及分析討論3、搭配互換性分析在新聞?wù)Z料,即書面語體中,互換性較低;尤其在作典型程度副詞時,傾向于“非?!?,而非“特別”;在小說語料,即中間語體中,出現(xiàn)微弱互換性;“非常好”、“非常漂亮”與“特別好”、“特別漂亮”的頻率接近;在口語語料庫,即口語語體中,出現(xiàn)一定互換性;但更傾向于“特別”,而非“非常”。互換性由高到低:口語語體、中間語體、新聞?wù)Z體;這也側(cè)面說明了各個語體的不同特點。結(jié)

論非?!迸c“特別”的用法都以副詞為主;典型程度副詞的使用占主要地位?!胺浅!钡男稳菰~用法屬于低頻用法,而“特別”的非副詞用法占有一定比例。在語域使用上,“非?!钡臅嬲Z體色彩較強,而“特別”的口語程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論