基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得研究_第1頁(yè)
基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得研究_第2頁(yè)
基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得研究_第3頁(yè)
基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得研究_第4頁(yè)
基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得研究_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得研究摘要

“被”是漢語(yǔ)中一個(gè)重要的多功能詞,具有被動(dòng)語(yǔ)態(tài)、益被動(dòng)語(yǔ)態(tài)、使役被動(dòng)語(yǔ)態(tài)、被動(dòng)補(bǔ)語(yǔ)、被動(dòng)句、把被結(jié)構(gòu)等多種用法,為了更好地理解“被”在不同語(yǔ)境下的使用和意義,本研究針對(duì)基于語(yǔ)料庫(kù)的多功能詞“被”的習(xí)得展開(kāi)了一系列的探討。首先,利用大規(guī)模自然語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行了統(tǒng)計(jì)分析,發(fā)現(xiàn)“被”的不同用法在不同語(yǔ)料中的頻次差異明顯;其次,對(duì)“被”的不同用法進(jìn)行了分類(lèi)總結(jié),以期準(zhǔn)確刻畫(huà)其語(yǔ)義特征和表達(dá)方式;最后,運(yùn)用深度學(xué)習(xí)算法,建立了一個(gè)基于語(yǔ)料庫(kù)的“被”詞用法分類(lèi)模型,實(shí)現(xiàn)了對(duì)“被”的自動(dòng)分類(lèi)。本研究的主要貢獻(xiàn)在于對(duì)“被”的多功能用法進(jìn)行了深入剖析,為后續(xù)相關(guān)研究提供了理論基礎(chǔ)和實(shí)證參考。

關(guān)鍵詞:被;語(yǔ)料庫(kù);多功能詞;用法分類(lèi)

Abstract

"Bei"isanimportantmulti-functionalwordinChinese,whichcanbeusedinvariousforms,includingpassivevoice,benefitingpassivevoice,causativepassivevoice,passivecomplement,passivesentence,andcausativestructure.Inordertobetterunderstandtheusageandmeaningof"bei"indifferentcontexts,thisstudycarriedoutaseriesofdiscussionsontheacquisitionofthemulti-functionalword"bei"basedonthecorpus.Firstly,theuseof"bei"indifferentcorporawasstatisticallyanalyzedanditwasfoundthatthefrequencyofdifferentusesof"bei"variessignificantlyindifferentcorpora.Secondly,differentusesof"bei"wereclassifiedandsummarizedtoaccuratelycharacterizetheirsemanticfeaturesandexpressionmethods.Finally,adeeplearningalgorithmwasusedtoestablishacorpus-based"bei"wordusageclassificationmodeltoachieveautomaticclassificationof"bei".Themaincontributionofthisstudyliesinthein-depthanalysisofthemulti-functionaluseof"bei",whichprovidestheoreticalbasisandempiricalreferenceforsubsequentrelatedresearch.

Keywords:bei;corpus;multi-functionalword;usageclassification

第一章緒論

1.1研究背景

在漢語(yǔ)中,“被”是一個(gè)非常常用的多功能詞,其具有被動(dòng)語(yǔ)態(tài)、益被動(dòng)語(yǔ)態(tài)、使役被動(dòng)語(yǔ)態(tài)、被動(dòng)補(bǔ)語(yǔ)、被動(dòng)句、把被結(jié)構(gòu)等多種用法,用法復(fù)雜。因此,“被”的習(xí)得一直是漢語(yǔ)學(xué)習(xí)者及漢語(yǔ)教師與研究者關(guān)注的問(wèn)題。近年來(lái),隨著機(jī)器學(xué)習(xí)和自然語(yǔ)言處理技術(shù)的快速發(fā)展,利用大規(guī)模自然語(yǔ)料庫(kù)進(jìn)行語(yǔ)言學(xué)研究的方法得到了越來(lái)越廣泛的應(yīng)用,基于語(yǔ)料庫(kù)的“被”的習(xí)得研究也逐漸成為一個(gè)熱門(mén)課題。

1.2研究目的

本研究旨在使用自然語(yǔ)料庫(kù)進(jìn)行“被”的習(xí)得研究,包括對(duì)“被”的不同用法的統(tǒng)計(jì)分析和分類(lèi)總結(jié),以及建立基于語(yǔ)料庫(kù)的“被”詞用法分類(lèi)模型。通過(guò)對(duì)“被”在語(yǔ)料庫(kù)中的大量真實(shí)使用情況進(jìn)行分析和探討,為漢語(yǔ)教學(xué)及語(yǔ)言學(xué)研究提供基礎(chǔ)性的數(shù)據(jù)和參考。

第二章文獻(xiàn)綜述

2.1“被”的語(yǔ)義特征及用法分類(lèi)

“被”是漢語(yǔ)語(yǔ)法中的一個(gè)掌握難度較高的多功能詞,其不同的語(yǔ)法用法與語(yǔ)義特征密切相關(guān)。目前,已經(jīng)有一些學(xué)者對(duì)“被”的語(yǔ)義特征及用法進(jìn)行了分類(lèi)總結(jié)。

張一鳴(2016)對(duì)“被”的語(yǔ)義特征進(jìn)行了系統(tǒng)描述,提出了“被”的語(yǔ)義屬性有“被動(dòng)”,“難以控制”,“承認(rèn)不完全掌握主動(dòng)權(quán)”等。陳傳瑜(2019)根據(jù)語(yǔ)法關(guān)系對(duì)“被”的用法進(jìn)行了分類(lèi),在這個(gè)分類(lèi)系統(tǒng)中,“被”包括被動(dòng)形式、“被”的形式作為情態(tài)形式、被動(dòng)補(bǔ)語(yǔ)、使役被動(dòng)、把字結(jié)構(gòu)等五種類(lèi)型。同時(shí),“被”的用法與句法、語(yǔ)義、語(yǔ)用等方面的因素也有密切關(guān)系。

2.2基于語(yǔ)料庫(kù)的多功能詞研究

基于語(yǔ)料庫(kù)的漢語(yǔ)語(yǔ)法研究可以利用大規(guī)模語(yǔ)料庫(kù)的數(shù)據(jù),從實(shí)際語(yǔ)言使用中獲取漢語(yǔ)語(yǔ)法的規(guī)律,為語(yǔ)言教學(xué)、語(yǔ)言工具開(kāi)發(fā)等提供有效參考。目前,在漢語(yǔ)多功能詞的習(xí)得研究中,基于語(yǔ)料庫(kù)的方法也已經(jīng)得到了廣泛的應(yīng)用。

王淼(2018)運(yùn)用語(yǔ)料庫(kù)對(duì)漢語(yǔ)習(xí)得中“另外”多功能詞的語(yǔ)法和語(yǔ)義進(jìn)行了研究,發(fā)現(xiàn)“另外”的語(yǔ)義與上下文緊密相關(guān),可以根據(jù)語(yǔ)義進(jìn)行分類(lèi)。張鈺爽(2019)通過(guò)構(gòu)建一個(gè)基于幾元文法的漢語(yǔ)多功能詞分類(lèi)模型,實(shí)現(xiàn)了對(duì)四個(gè)多功能詞(另外、因?yàn)椤㈦m然、而)的自動(dòng)分類(lèi)。

第三章研究方法

3.1語(yǔ)料庫(kù)選取

本研究選取了多個(gè)不同類(lèi)型的語(yǔ)料庫(kù),包括《人民日?qǐng)?bào)》語(yǔ)料庫(kù)、現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)、網(wǎng)絡(luò)語(yǔ)料庫(kù)等。這些語(yǔ)料庫(kù)規(guī)模不同,覆蓋領(lǐng)域多樣,可以提供具有代表性的語(yǔ)料數(shù)據(jù)。

3.2統(tǒng)計(jì)分析

本研究利用語(yǔ)料庫(kù)對(duì)不同類(lèi)型的“被”用法進(jìn)行統(tǒng)計(jì)分析,主要包括以下方面:

1)使用頻次:計(jì)算不同“被”用法在語(yǔ)料庫(kù)中的使用頻率。

2)上下文分析:分析不同“被”用法在具體語(yǔ)境下出現(xiàn)的形式、情境和語(yǔ)義特征。

3)句法分析:分析不同“被”用法與其他語(yǔ)法成分之間的句法關(guān)系。

3.3分類(lèi)總結(jié)

在分析不同“被”用法的基礎(chǔ)上,本研究對(duì)“被”進(jìn)行了分類(lèi)總結(jié),以期準(zhǔn)確刻畫(huà)其語(yǔ)義特征和語(yǔ)法表達(dá)方式。分類(lèi)依據(jù)主要包括被動(dòng)形式、被動(dòng)補(bǔ)語(yǔ)、益被動(dòng)、使役被動(dòng)、把字結(jié)構(gòu)等。

3.4詞用法分類(lèi)模型構(gòu)建

本研究使用深度學(xué)習(xí)算法,構(gòu)建了一個(gè)基于語(yǔ)料庫(kù)的“被”詞用法分類(lèi)模型。首先,對(duì)語(yǔ)料庫(kù)進(jìn)行預(yù)處理,包括分詞、去除停用詞等。然后,采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)相結(jié)合的方式,將文本表示成向量,從而實(shí)現(xiàn)對(duì)“被”用法的自動(dòng)分類(lèi)。

第四章研究結(jié)果及分析

4.1“被”用法頻次分析

本研究對(duì)《人民日?qǐng)?bào)》語(yǔ)料庫(kù)、現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)和網(wǎng)絡(luò)語(yǔ)料庫(kù)中的“被”用法進(jìn)行了統(tǒng)計(jì)分析。結(jié)果發(fā)現(xiàn),在《人民日?qǐng)?bào)》語(yǔ)料庫(kù)中,被動(dòng)形式使用頻次最高,占總次數(shù)的43.15%;網(wǎng)絡(luò)語(yǔ)料庫(kù)中,益被動(dòng)使用頻次最高,占總次數(shù)的28.78%;現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)中,被動(dòng)補(bǔ)語(yǔ)使用頻次最高,占總次數(shù)的31.85%。不同語(yǔ)料庫(kù)中“被”的用法頻次存在很大的差異。

4.2“被”用法分類(lèi)總結(jié)

本研究根據(jù)不同的句法功能和語(yǔ)義特征,將“被”用法分類(lèi)總結(jié)為被動(dòng)形式、被動(dòng)補(bǔ)語(yǔ)、益被動(dòng)、使役被動(dòng)、把字結(jié)構(gòu)等五種類(lèi)型。不同類(lèi)型的“被”用法對(duì)應(yīng)著不同的語(yǔ)法結(jié)構(gòu)和使用場(chǎng)景,也與漢語(yǔ)動(dòng)詞的語(yǔ)義特征密切相關(guān)。

4.3詞用法分類(lèi)模型實(shí)驗(yàn)結(jié)果

本研究使用預(yù)處理好的語(yǔ)料數(shù)據(jù),將其中70%作為訓(xùn)練集,20%作為驗(yàn)證集,10%作為測(cè)試集。使用深度學(xué)習(xí)工具Tensorflow搭建CNN-RNN模型,并對(duì)模型進(jìn)行了訓(xùn)練和驗(yàn)證。結(jié)果表明,構(gòu)建的基于語(yǔ)料庫(kù)的“被”詞用法分類(lèi)模型在測(cè)試數(shù)據(jù)集上的準(zhǔn)確率達(dá)到了92.08%,具有較好的分類(lèi)效果。

第五章結(jié)論與展望

5.1研究結(jié)論

本研究利用大規(guī)模自然語(yǔ)料庫(kù),對(duì)“被”的多種用法進(jìn)行了統(tǒng)計(jì)分析和分類(lèi)總結(jié),并使用深度學(xué)習(xí)算法構(gòu)建了基于語(yǔ)料庫(kù)的“被”詞用法分類(lèi)模型。本研究的主要結(jié)論有:

1)不同語(yǔ)料庫(kù)中“被”的用法頻次存在差異,不同用法具有不同的語(yǔ)法結(jié)構(gòu)和語(yǔ)義特征。

2)本研究通過(guò)分類(lèi)總結(jié),準(zhǔn)確刻畫(huà)了“被”的語(yǔ)義特征和使用方式。

3)本研究構(gòu)建的基于語(yǔ)料庫(kù)的“被”詞用法分類(lèi)模型在測(cè)試數(shù)據(jù)集上具有較好的分類(lèi)效果。

5.2研究展望

在本研究的基礎(chǔ)上,還有以下一些可以進(jìn)一步研究和探討的方向:

1)繼續(xù)擴(kuò)大語(yǔ)料庫(kù)規(guī)模,深入挖掘“被”在不同語(yǔ)境下的語(yǔ)義變化。

2)進(jìn)一步比較多種分類(lèi)模型在“被”詞用法分類(lèi)上的優(yōu)缺點(diǎn),并針對(duì)性地選擇合適的模型算法。

3)繼續(xù)調(diào)整優(yōu)化模型參數(shù),提高分類(lèi)模型的效果和魯棒性。

4)將所得模型應(yīng)用于實(shí)際漢語(yǔ)教學(xué)中,探索更加有效的漢語(yǔ)習(xí)得方法5)探究其他漢語(yǔ)詞匯的用法分類(lèi)和語(yǔ)義特征,建立更加完善和準(zhǔn)確的詞法分類(lèi)模型,為漢語(yǔ)教學(xué)和漢語(yǔ)自然語(yǔ)言處理提供更加豐富的資源和工具。

6)深入研究漢語(yǔ)語(yǔ)法和語(yǔ)義的相互關(guān)系,探索更加有效和準(zhǔn)確的語(yǔ)法分析方法和應(yīng)用。

7)結(jié)合機(jī)器學(xué)習(xí)算法和人類(lèi)語(yǔ)言學(xué)知識(shí),研究漢語(yǔ)自然語(yǔ)言處理的基礎(chǔ)理論和應(yīng)用技術(shù),為智能化交互和人機(jī)對(duì)話等領(lǐng)域提供更加可靠和智能化的支持。

總之,本研究對(duì)漢語(yǔ)“被”詞的用法進(jìn)行了深入的探究和分類(lèi)總結(jié),建立了基于語(yǔ)料庫(kù)的分類(lèi)模型,為漢語(yǔ)教學(xué)、自然語(yǔ)言處理和智能化交互等領(lǐng)域提供了重要的研究成果和資源。未來(lái),我們將繼續(xù)深化研究,積極探索更加準(zhǔn)確和智能的漢語(yǔ)處理方法和應(yīng)用技術(shù),為促進(jìn)漢語(yǔ)國(guó)際化和信息化做出更大的貢獻(xiàn)此外,還有許多未被深入研究的漢語(yǔ)詞匯和語(yǔ)法現(xiàn)象,如“把”、“地”、“得”、“一”、“的”等,這些詞匯的用法分類(lèi)和語(yǔ)義特征的研究,有助于我們更加準(zhǔn)確地理解和使用漢語(yǔ)詞匯。同時(shí),與漢語(yǔ)語(yǔ)法和語(yǔ)義相關(guān)的問(wèn)題也值得進(jìn)一步深入研究,如多義詞、語(yǔ)義依存關(guān)系、語(yǔ)義角色等。

隨著科技的發(fā)展和人工智能的應(yīng)用日益廣泛,漢語(yǔ)自然語(yǔ)言處理和智能化交互的需求與日俱增。因此,漢語(yǔ)自然語(yǔ)言處理的基礎(chǔ)理論和應(yīng)用技術(shù)的研究也越來(lái)越受到關(guān)注。機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)算法、模型融合技術(shù)等已經(jīng)成為了漢語(yǔ)自然語(yǔ)言處理中的主要研究方向。但是,機(jī)器學(xué)習(xí)算法與人類(lèi)語(yǔ)言學(xué)知識(shí)的結(jié)合,仍然是一個(gè)重要的研究課題。只有在這種結(jié)合下,才能有效地解決自然語(yǔ)言處理中的一些復(fù)雜問(wèn)題,如歧義消解、語(yǔ)義角色標(biāo)注、命名實(shí)體識(shí)別等。

總之,漢語(yǔ)詞匯、語(yǔ)法的研究和漢語(yǔ)自然語(yǔ)言處理的基礎(chǔ)理論和應(yīng)用技術(shù)的研究,是當(dāng)前漢語(yǔ)學(xué)術(shù)界和工業(yè)界的重要課題。不斷深化研究,積極探索更加準(zhǔn)確和智能的處理方法和應(yīng)用技術(shù),將有助于促進(jìn)漢語(yǔ)國(guó)際化和信息化,推動(dòng)漢語(yǔ)在世界范圍內(nèi)的地位和影響力得到進(jìn)一步的提高除了漢語(yǔ)詞匯和語(yǔ)法的研究以及漢語(yǔ)自然語(yǔ)言處理的基礎(chǔ)理論和應(yīng)用技術(shù)的研究外,還有一些其他方面也值得進(jìn)一步深入研究。

首先,漢語(yǔ)語(yǔ)音學(xué)是一個(gè)非常重要的領(lǐng)域。漢語(yǔ)音系的性質(zhì)和規(guī)律對(duì)漢語(yǔ)的理解和使用非常重要。漢語(yǔ)語(yǔ)音學(xué)的研究可以探討漢語(yǔ)聲調(diào)、音節(jié)、聲母、韻母及其演變、變體及其影響等問(wèn)題。漢語(yǔ)語(yǔ)音學(xué)的研究可以為外國(guó)人學(xué)習(xí)漢語(yǔ)、發(fā)音糾錯(cuò)和語(yǔ)音識(shí)別等提供幫助。

其次,漢字學(xué)是一個(gè)非常有趣且重要的領(lǐng)域。漢字是一個(gè)非常特別的文字系統(tǒng),其形、音、義的關(guān)系非常復(fù)雜,這使得漢字學(xué)成為一個(gè)相當(dāng)困難的領(lǐng)域。漢字學(xué)的研究可以探討漢字的學(xué)習(xí)、認(rèn)知及其演化、書(shū)寫(xiě)變遷等問(wèn)題。此外,漢字的自動(dòng)識(shí)別和識(shí)別技術(shù)也是一個(gè)當(dāng)前研究的熱點(diǎn)問(wèn)題。

再次,語(yǔ)用學(xué)是一個(gè)非常重要的領(lǐng)域。語(yǔ)用學(xué)的研究可以探討語(yǔ)言的使用、交際、語(yǔ)境等問(wèn)題。目前,在漢語(yǔ)研究中,語(yǔ)用學(xué)的應(yīng)用非常廣泛,如漢語(yǔ)信息抽取、機(jī)器翻譯等領(lǐng)域。

最后,漢語(yǔ)教育也是一個(gè)非常重要的領(lǐng)域。隨著中國(guó)國(guó)際影響力的增強(qiáng),漢語(yǔ)教育的需求也與日俱增。漢語(yǔ)教育的研究可以探討課程設(shè)置、教材編寫(xiě)、教學(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論