《漢語水平大綱》中的詞語選擇和分級研究_第1頁
《漢語水平大綱》中的詞語選擇和分級研究_第2頁
《漢語水平大綱》中的詞語選擇和分級研究_第3頁
《漢語水平大綱》中的詞語選擇和分級研究_第4頁
《漢語水平大綱》中的詞語選擇和分級研究_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《漢語水平大綱》中的詞語選擇和分級研究

漢語水平結構(以下簡稱結構)中單詞的選擇和分類是一個非常重要的研究主題。大綱漢字、詞匯的選擇和分級標準的制定,要考慮的因素很多,不但要依據基于漢語母語者語料的常用字詞的統(tǒng)計學研究(字或詞的出現頻率、字的構詞能力等),也要考慮外國人漢語字詞學習的規(guī)律。影響外國人字詞學習的因素有哪些?哪些字詞先學會、容易學會,哪些字詞后學會、不容易學會?對這些問題進行實證的定量研究和定性研究,可以從外國人字詞學習的角度為《大綱》字詞選擇、分級、排序提供科學的理論依據。一外國人漢字學習研究已有的關于本族人學習漢語的研究表明,從漢字屬性特征的角度看,影響漢字學習的主要因素有:(1)出現頻率。出現頻率高的漢字比出現頻率低的漢字易學。(2)字形復雜性。字形復雜性包括筆畫數、部件數、筆畫類型、字形對稱性等特征。筆畫數少的漢字比筆畫數多的漢字易學,部件少的漢字比部件多的漢字易學,筆畫橫直的漢字比筆畫斜曲的漢字易學,字形對稱的漢字比字形不對稱的漢字易學。(3)結構類型。左右結構的字比上下結構的字易學,左右、上下結構字比包孕結構字易學。外國人漢字學習是否具有類似的規(guī)律,還需進一步研究。近十年來,針對外國人的漢語字詞學習的研究逐漸增多。該領域進行的實證研究主要包括以下幾個方面:(1)漢字的頻率、字形復雜性、構詞數等屬性特征對漢字學習效果的影響(Sergent&Everson1992,周清海、梁榮基1995,柳燕梅2002,江新2004,趙果2003);(2)漢字聲旁意識和形旁意識(Shen2000,江新2001,陳慧、王魁京2001);(3)漢字學習策略(McGinnis1999,Ke1998,江新、趙果2001,趙果、江新2002);(4)漢字識別與漢字書寫的關系(Ke1996);(5)漢語字詞知音與知義的關系(Everson1998,Yang2000,江新2003a);(6)漢字教學方法(柳燕梅、江新2003);(7)接受型詞匯與表達型詞匯之間的距離(Lin2000,鹿士義2001);(8)漢字正字法意識(鹿士義2001,江新2003b);(9)漢字書寫錯誤(江新、柳燕梅2004);(10)漢語虛詞的學習(Wen1995、1997,Teng1999,Polio1994,Kuo2000,Bourgerie1996)。漢語虛詞的學習常常被看成是語法習得的范圍。我們研究的重點為實詞的學習。外國人漢語字詞學習研究取得了一些成果,但迄今為止,還很少有人從《大綱》字詞選擇和分級標準的制定需要出發(fā),來系統(tǒng)總結和歸納已有的字詞學習研究成果,并就外國人字詞學習的影響因素進行有針對性的實證研究。本文擬從兩個方面進行研究:(1)實驗研究:對外國人字詞學習的影響因素進行實驗研究。包括漢字使用頻率、構詞能力、字形復雜性(筆畫數、部件數)等因素對漢字學習的影響;詞語的使用頻率、字的使用頻率等因素對詞語學習的影響。(2)語料分析:對外國人漢字和詞語使用的情況進行統(tǒng)計和分析。包括不同階段留學生實際擁有的漢字量和詞匯量(教學字詞量不一定等于學生實際擁有的字詞量)、并將留學生作文常用詞與《大綱》詞匯進行對比。二外國人漢語學習的影響因素研究2.1實驗1:漢字輸入頻率、構詞數、書法和繪畫的數與學習漢字的關系2.1.1學習和測試漢字被試為在北京語言大學學習漢語的一年級第一學期的非漢字圈國家留學生28人,他們是以英語、法語或俄語等語言為母語、漢語作為第二語言的漢語初學者,學習的教材為楊寄洲主編的《漢語教程》(北京語言文化大學出版社1997),每周24學時,測驗時學習時間為4個月,近400個學時,學完了1至33課。從《漢語教程Ⅰ》的前33課課文和生詞表中出現的漢字中隨機選取102個字進行測驗。要求被試根據字形寫出漢字的拼音并組詞或短語。然后計分,拼音計分時聲母和韻母正確就計為正確,忽略聲調;意義計分時詞或短語的意義正確就計為正確,忽略字形。同時,統(tǒng)計每個漢字的四個屬性:(1)出現頻率。統(tǒng)計漢字在前33課的課文和生詞表中出現的次數,作為漢字在教材中的出現頻率(也稱為教材字頻);(2)構詞能力。統(tǒng)計每個漢字在前33課的生詞中參與構詞的次數,作為漢字的構詞能力;(3)筆畫數;(4)部件數,統(tǒng)計以上海交通大學漢字編碼組主編的《漢字信息字典》中的數據為準。2.1.2影響漢字教學成績的因素采用相關分析的統(tǒng)計方法對數據進行分析,探討漢字的出現頻率、構詞能力、筆畫數、部件數與漢字學習效果的關系,結果見表1。表1簡單相關分析的結果表明,漢字的頻率、構詞數、筆畫數、部件數與漢字測驗成績都有顯著相關。從拼音成績看,漢字的頻率、構詞數與漢字拼音成績有顯著的正相關關系,即漢字頻率越高,構詞數越高,漢字測驗成績越好。漢字的筆畫數、部件數與漢字拼音成績有顯著負相關,即筆畫數越多、部件數越多,漢字拼音成績越差。意義成績也有相同的統(tǒng)計結果。但是,由于頻率、構詞數、筆畫數和部件數這幾個變量之間可能存在相互關系,因此,為了研究在其中兩個變量的影響保持恒定的情況下另一個變量與漢字成績之間的相關,我們對漢字的頻率、構詞數等因素與漢字測驗成績之間的關系進行了偏相關分析,見表2。由表2可見,對于頻率、構詞數、筆畫數和部件數這四個因素,當控制了其中三個因素對某個因素以及漢字拼音成績的影響,與拼音成績的相關系數最大的就是構詞數,其次是頻率,最小的是筆畫數、部件數。具體地說,當控制了頻率、筆畫數、部件數對構詞數與漢字拼音成績的影響,構詞數與漢字拼音成績的相關系數仍然非常顯著;但是,當控制了構詞數、筆畫數、部件數對頻率與漢字拼音成績的影響,頻率與漢字拼音成績之間的相關變得很弱,相關系數不顯著;同樣,當控制了其他三個因素的影響,筆畫數、部件數與漢字拼音成績之間的偏相關都不顯著。對四個因素與意義成績的偏相關分析也得到了相同的結果。從簡單相關看,漢字的出現頻率、構詞數、筆畫數、部件數與漢字學習效果都是相關的;從偏相關看,漢字的構詞數與漢字學習效果的關系最為密切。本實驗只是一個相關性研究,要知道這些因素與漢字學習效果之間是否存在因果關系,還必須進行控制比較嚴格的實驗研究。2.2統(tǒng)計方法與結果以非漢字圈國家的留學生為被試,從留學生已學過的教材的詞表中隨機選擇一定數量雙字詞和多字詞進行測試,要求被試進行識別(寫出詞語的拼音并組成短語),采用相關分析的統(tǒng)計方法對數據進行分析,探討整詞的出現頻率、單字的出現頻率與整詞學習效果的關系。2.2.1按最小字作詞匯,統(tǒng)計整詞在第32課中的頻率和頻率被試與實驗1的被試相同。測驗材料是從《漢語教程Ⅰ》的前33課的生詞表(包括人名、專名和補充生詞)中隨機選取的76個雙音節(jié)和三音節(jié)詞。要求被試根據詞形寫出詞的拼音并寫出意義(用被試熟悉的語言來寫)。計分原則同實驗1。同時,統(tǒng)計每個詞的兩個屬性:(1)出現頻率。統(tǒng)計整詞在前33課的課文中出現的次數,作為整詞在教材中的出現頻率;(2)單字出現的頻率。統(tǒng)計詞中的每個漢字在前33課的課文中出現的次數,作為單字的出現頻率。2.2.2整詞頻率、登記頻率與整詞測驗成績之間的關系表3表明,整詞頻率、單字頻率與整詞測驗成績都有顯著相關,頻率越高,測驗成績越好。但是,由于整詞頻率、單字頻率這兩個變量之間可能存在相互關系,因此,為了研究在其中一個變量的影響保持恒定的情況下另一個變量與測驗成績之間的相關,我們對整詞頻率、單字頻率與整詞測驗成績之間的關系進行了偏相關分析,見表4。由表4可見,當控制了單字頻率對整詞頻率與整詞拼音成績的影響,整詞頻率與漢字拼音成績的相關系數不顯著;但是,當控制了整詞頻率對單字頻率與整詞拼音成績的影響,單字頻率與整詞拼音成績之間的相關仍然非常顯著。對兩個因素與意義成績的偏相關分析也得到了相同的結果。從簡單相關看,整詞的出現頻率、單字的出現頻率與整詞學習效果都是相關的;從偏相關看,單字出現頻率與整詞學習效果的關系最為密切。實驗2也只是一個相關研究,要知道整詞的出現頻率、單字的出現頻率與整詞學習效果之間是否存在因果關系,還必須進行控制比較嚴格的實驗研究。2.3選擇高頻的漢字教學改革綜合以上兩個實驗的結果,我們得到以下初步結論。(1)外國人的漢字學習效果受漢字出現頻率、構詞數、字形復雜性(筆畫數、部件數)的影響。出現頻率越高、構詞數越多、筆畫數和部件數越少,學習效果越好。這個結論提示我們,要選擇高頻的常用的漢字教給學生,而且要按照頻率高低和常用程度來決定漢字在大綱中的等級,高頻的常用的字先學習,等級較低;低頻的不常用的字后學習,等級較高。還要選擇構詞能力強的漢字教給學生,而且要通過提高生字在學生已有詞匯中的構詞數,來提高生字的學習效果。此外,字形簡單的字先學習,字形復雜的字后學習。(2)外國人的詞語學習受整詞出現頻率和單字出現頻率的影響。整詞出現頻率越高,單字出現頻率越高,詞的學習效果越好。因此,我們要選擇出現頻率高的合成詞教給學生,同時也要重視選擇出現頻率高的漢字教給學生。選擇基礎的常用字教給學生,既有助于單字的學習,也有助于詞匯的學習。三漢語單詞和短語的統(tǒng)計分析3.1高校作文語料的統(tǒng)計分析我們收集了不同國家、不同年級的外國學生漢語作文語料。所有語料都是學生在考試時獨立完成的作文,是比較自然、真實的語料。本研究以其中一部分語料為基礎,來統(tǒng)計分析留學生作文用字和用詞情況。從所收集的作文語料中分別隨機選擇不同國家(韓國、日本、東南亞、非漢字圈)、不同水平(初級、中級、中高級)12-20人的主題相似的語料(共107333字)進行統(tǒng)計分析。選取語料時盡可能使語料來源在學生的國籍、漢語水平這兩個因素上是平衡的,語料的主題也基本一致(理想的做法是,使語料包括多個主題、而且語料的主題在不同國家和學生的漢語水平上平衡,遺憾的是,目前我們還做不到這一點)。見表5。3.2不同階段學生漢字和詞語的使用選取適當的語料樣本后,我們對留學生作文中使用的漢字和詞語的數量、使用頻率進行了統(tǒng)計。漢字的統(tǒng)計比較容易,詞語的統(tǒng)計牽涉詞切分的問題,所以比較困難。本文采用機器自動切分然后進行人工校對的方法。自動切分后,請從事對外漢語教學和研究的語言學專業(yè)的研究生、教師進行人工校對,對機器切分的明顯錯誤進行改正。我們分別統(tǒng)計了初級、中級、中高級三個階段學生的漢字數量和詞語數量。表6是不同階段留學生漢字和詞語數量的統(tǒng)計結果。下面將留學生漢字和詞匯使用量與《大綱》的要求進行比較。由于我們只統(tǒng)計了從初級到中高級(三年級)學生的語料,所以只與《大綱》丙級的要求比較。通過比較可以看到,在統(tǒng)計的語料中,留學生使用的漢字總量(1847個)還達不到《大綱》丙級要求的漢字量(2205個),留學生使用的詞語總量(3985個)也遠未達到《大綱》丙級要求的詞匯量(5253個)。統(tǒng)計得到的漢字和詞語使用總量與《大綱》要求的數量存在差距,有三個可能的因素:一是學生的實際用字量和用詞量不止這么多,但由于所統(tǒng)計語料的主題比較單一,樣本量也不夠大,所以統(tǒng)計結果并不能完全反映留學生實際的用字量和用詞量。二是該方法統(tǒng)計出來的只是學生的產生型漢字量和詞匯量,而學生的識別型漢字量、詞匯量比產生型的要大。三是學生的漢字量和詞匯量確實沒有達到《大綱》的要求,這是因為學生學得不夠多、輸入漢字量和詞匯量不夠大,還是因為《大綱》要求過高?這一問題值得研究。3.3《大綱》的收入我們統(tǒng)計了初級到中高級學生的漢字和詞語使用頻率,得到不同階段留學生漢字使用頻率表、詞語使用頻率表。比較發(fā)現,留學生經常使用的一些詞語《大綱》并未收入。例如:雙字組:表姐地獄點菜敦厚法語刮風漢族好漢好玩回歸回國回家吉他記住解脫京劇烤鴨厲害聊天臨死魅力面條母語難忘期末期中錢包清淡缺課人才日語入世軟臥思路寺廟聽力外語吸煙下次下雪陽臺英文英語油膩早上總是走路足跡三字組:比如說火車票拉肚子旅行社上個月實際上手提包售貨員售票員俗話說太極拳下星期音樂會怎么辦只不過主人公四字組:大吃一驚各種各樣哈哈大笑好不容易胡思亂想另一方面沒完沒了名勝古跡寧死不屈萬事如意一般來說一無所有總而言之此外還有不少常用的專名《大綱》也沒有收入(但教材中一般都有),例如“中國、英國、德國、法國、歐洲、亞洲、非洲、瑞典、東京、漢城、廣州、蘇州、杭州、黃河、天壇、故宮”等。上述詞語在我們統(tǒng)計的語料中出現的次數都不少,從直覺上看也是常用的,是學生應該掌握的,但是《大綱》沒有收入?!洞缶V》選詞時一方面依靠母語者語料的頻率統(tǒng)計,另一方面依靠專家的直覺判斷。但僅這兩個方面還不夠,還應該對學習者的詞匯使用情況進行分析。本研究對留學生漢字和詞語使用頻率所做的統(tǒng)計,有助于了解留學生的常用字和常用詞,為漢字和詞匯大綱的編制提供參考。當然,由于語料、詞切分等諸多限制,本研究提供的留學生字頻和詞頻資料(特別是詞頻資料)還存在許多不足,因此本研究在方法上的意義可能大于實際資料的意義。四選擇和分類素描中的詞4.1詞匯的基本原則《大綱》所收的詞應是常用詞,這一點大家已達成共識。確定現代漢語的常用詞匯或基礎詞匯,是編制詞匯大綱的基礎,但如何確定常用詞卻不是一個簡單的問題。劉英林、宋紹周(1992)指出了已有詞匯大綱選擇詞語遵循的8條原則:常用性原則、均勻性原則、科學性原則、規(guī)范性原則、實用性原則、聯想性原則、包容性(節(jié)省性)原則、序列性(等級性)原則。從實際操作的角度看,以上原則可以概括為以頻率和使用度為主、以專家主觀判斷為輔。這種客觀與主觀相結合的方法,是合理的,也是可行的。但《大綱》采用時存在以下問題。(1)根據語料統(tǒng)計所產生的對比,有以下幾種頻率統(tǒng)計所依據的語料存在的主要問題是:書面語體語料較多、口語語體語料較少(孫德金1995),語料過時,語料的數量不夠大(僅一百多萬)。趙金銘等(2003)也認為用于詞頻統(tǒng)計的語料在數量、范圍和語體等方面存在不足。因此,根據這些語料統(tǒng)計所得的詞頻選擇常用詞,必定導致有些常用詞沒有收入,有些非常用詞卻收了進去。例如《大綱》有“根據地”,沒有“騙子”(孫德金1995),有“法西斯”而沒有“小偷”,有“帝國主義”而沒有“電腦”。因此,新的詞匯大綱依據的詞頻統(tǒng)計應該基于及時更新的語料。(2)進行詞匯聯想測驗主觀判斷可以彌補頻率統(tǒng)計方法的不足,但僅局限于幾十位專家聯想干預是不夠的,應該借鑒國外基礎詞匯研究的方法,采用調查法(孫德金1995),進行大樣本的詞匯聯想測驗或主題聯想測驗。(3)聯想干預方法有的詞語在詞頻統(tǒng)計中可能屬于低頻詞,但在留學生的日常生活中卻是常用詞,例如“米飯”。哪些詞屬于這樣的詞,這個問題靠專家聯想干預的方法可以在一定程度上解決,但不能完全解決。專家聯想干預是一種主觀方法,應結合客觀方法進行。研究留學生常用詞的客觀方法有二:一是以廣泛使用的對外漢語教材的課文語料和詞表為基礎統(tǒng)計詞頻和常用詞。二是以留學生的語料為基礎統(tǒng)計詞頻,根據留學生詞語使用頻率來確定常用詞。趙金銘(1989)曾使用過第一種方法。確定常用字時,他除了依據字的頻率(基于母語者語料的統(tǒng)計)、字的構詞能力,還依據對四部基礎漢語教材用字的統(tǒng)計。后一種方法,已發(fā)表的論文中至今未見采用。本研究采用該方法對留學生常用詞語進行了研究,在統(tǒng)計留學生詞語使用頻率方面提供了一個樣例,以期為詞匯大綱修訂提供方法上和資料上的參考。(4)詞匯學習不利只根據詞的出現等級來決定漢字的等級,可能對漢字學習不利,最終導致對詞匯學習不利。在處理字詞關系時,是否可以考慮針對漢語詞多字少的特點、采取以字定詞的方法?這個問題下面還要詳細討論。4.2選擇和分類新概念的原則綜上,我們?yōu)榈燃壌缶V的字詞選擇和排序、字詞關系的處理等問題的解決提出兩種方法。4.2.1“以字定詞”的使用第一步:選擇漢字。根據漢字的出現頻率(依據母語者語料的統(tǒng)計)和留學生使用頻率(依據留學生語料的統(tǒng)計)來選擇漢字。例如,先確定各個等級應該學習的漢字量(例如前1000、1500、2000、2500個高頻字)。第二步:以字找詞。在不同頻率等級的詞中找出由這些漢字組成的所有的詞。例如,確定各個等級應該掌握的詞匯量(例如前1000、3000、5000、10000個高頻詞),并分別在不同詞頻等級的詞中找出由這些字組成的詞。表7是以北京語言大學信息科學系網站提供的以小說為文本統(tǒng)計的字頻和詞頻資料為例,對各個頻率等級漢字在各個頻率等級詞匯中的構詞數進行統(tǒng)計的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論