年語言學研究前沿報告_第1頁
年語言學研究前沿報告_第2頁
年語言學研究前沿報告_第3頁
年語言學研究前沿報告_第4頁
年語言學研究前沿報告_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2001年語言學研究前沿報告

2001年我國的語言科學事業(yè)取得了很大的成績,也存在一些問題,現將其主要分支的前沿態(tài)勢報告如下。一古代漢語研究(一)語法方面2001年的古漢語語法研究繼續(xù)呈現深化、細化的趨勢。學者們普遍運用當代的一些較新的語法觀念來觀察、分析問題,同時又不囿于現有觀念,依照古漢語的事實提出新的觀點。姚振武《上古漢語第三身范疇的表達及相關問題》一文(《古漢語研究》第4期。按:如無特別注明,論文的發(fā)表時間均為2001年,下同),就古漢語第三身代詞問題這一事關古漢語重要特征的敏感問題提出了新的見解。該文認為,與現代漢語和印歐語不同,在古代漢語中不存在指示代詞與第三人稱代詞的區(qū)別,為此,文章提出了“古指稱詞”的概念,以取代“第三身代詞”和“指示代詞”。這提示,古、今漢語的區(qū)別還體現為詞類格局的不同。梁銀峰《先秦漢語的新兼語式》一文(《中國語文》第4期),提出了“準動補結構”的概念,并認為它是使成式結果補語的前身。這個觀點對于漢語動補結構的產生具有重要的參考價值。錢宗武《今文〈尚書〉語氣詞的語用范圍和語用特征》(《古漢語研究》第4期),對今文《尚書》語氣詞的運用作了窮盡性的分析統(tǒng)計,指出,早期的語氣詞語用特征模糊,功能混同,語氣詞之間沒有明顯分工。這一結論不僅對于語氣詞的演變,而且對于其他詞類的演變,均具有理論價值。殷國光《〈呂氏春秋〉句子的界定》一文(《語言文字學》第7期)提出,界定上古漢語的句子應當兼顧語音、句法、語用三個層面。該文是迄今為止對上古漢語句子研究得最為細致、全面的論著之一。此外,何亞南《漢語處置式探源》(《南京師范大學學報》第5期),李杰群《連詞“則”的起源和發(fā)展》(《中國語文》第6期),楊逢彬《關于殷墟甲骨刻辭的形容詞》(《古漢語研究》第1期)等論文在各自領域均提出了有參考價值的新觀點。本年度出版的專著有伍宗文的《先秦漢語復音詞研究》(巴蜀書社,2001)。該書力圖運用現代語言學的構詞理論研究先秦漢語的構詞,在諸多方面作了深入的、有益的探索。還有方有國的《上古漢語語法研究》(巴蜀書社,2001),該書實際上是作者多年從事古漢語語法研究的論文集,書中對于古漢語虛詞“為”、“者”、“所”、“之”、“而”等作了比較深入的研究,時有獨到見解。(二)文字、訓詁方面2001年的漢語文字學和古文字學的研究成果還是很豐碩的。一般文字學,主要成果集中在《說文》學和現代漢字學上。至于古文字學,隨著郭店楚簡等簡帛文獻研究的深入以及上博楚簡的出版,加上近來其他一些新出土的甲骨、青銅器、玉器銘文等文獻,古文字學研究進入了一個新的局面。尤其是戰(zhàn)國文字,進展尤為迅速。很多學者都充分利用戰(zhàn)國文字研究的成果,上探甲骨文、金文。但是總的來說,2001年的漢語文字學和古文字學研究仍然以零星的考釋居多,綜合性的論述較少。2001年語言文字學界的大事之一是普及、貫徹和學習《國家通用語言文字法》,并為此召開了座談會,很多文章都談到了文字規(guī)范問題,并就漢字的繁簡優(yōu)劣進行了探討。同時就建國后異體字整理的是非也有學者進行了匯總(劉延玲《近五十年來異體字研究與整理狀況綜述》,《辭書研究》第6期)。除了正常的學術爭鳴之外,學術界還就徐德江漢字研究中的偽科學問題進行了嚴厲的批判(王寧、鄒曉麗、王?!秱慰茖W的來源和學者的辨?zhèn)问姑罚秾W術界》第1期)。2001年初,中國文字起源學術研討會在京召開,李學勤先生在會上作了《文字起源研究是科學的重大課題》的報告,指出文字起源問題是古文字學研究的重大問題(《中國書法》第2期)。在會上,還有不少學者提交了論文。7月三國吳簡暨百年來簡帛發(fā)現與研究國際學術研討會在長沙召開,會議前問世的《簡帛研究·二〇〇一》(廣西師范大學出版社,2001)以及會議上提交的有關論文有不少成果與古文字學密切相關。而《古文字研究》則由中華書局出版了第21輯,從甲骨文、金文、戰(zhàn)國文字一直到《說文》等都有論文研究。本年度還有不少古文字工具書與有關資料出版。如《殷周金文集成釋文》(香港中文大學中國文化研究所,2001)、《殷周金文集成引得》(中華書局,2001)、《金文引得(殷商西周卷)》(廣西教育出版社,2001)、《上海博物館藏戰(zhàn)國楚竹書(一)》(上海古籍出版社,2001)、《龍崗秦簡》(中華書局,2001)、《馬王堆簡帛文字編》(文物出版社,2001)、《銀雀山漢簡文字編》(文物出版社,2001)、《張家山漢墓竹簡》(文物出版社,2001)、《敦煌懸泉月令詔條》(中華書局,2001)等相繼出版,帶動了古文字研究的進一步深入。2001年古文字學界有幾個熱點問題,其中最熱門的還是以楚文字為首的戰(zhàn)國文字研究。隨著郭店楚簡以及其他相關楚文字的研究繼續(xù)深入,各種研究成果已經相當可觀。即使以郭店楚簡的文字考釋而論,有關的論文已達上百篇之多。陳斯鵬《郭店楚簡文字研究綜述》(《華學》第5輯,中山大學出版社,2001)對此作了系統(tǒng)的論述。可以說目前為止楚文字的資料已經相當豐富了,但是現在還缺少有分量的系統(tǒng)總結有關研究成果的綜合性著作。我們期待著有關的研究能夠早日問世。此外,對于殷墟卜辭命辭的性質也是一個討論熱點。張玉金《殷墟卜辭命辭語言本質及其語氣研究述評》(《古籍整理研究學刊》第1期)、趙誠、陳曦《殷墟卜辭命辭性質討論述要》(《古籍整理研究學刊》第1期)都對有關論點作了系統(tǒng)的總結。但是總結并不意味著終結,這一問題還會繼續(xù)討論下去。本年度的另外一個熱點就是秦骃玉版,曾憲通、楊澤生、肖毅《秦骃玉版文字初探》(《考古與文物》第1期)、李家浩《秦骃玉版銘文研究》[《北京大學中國古文獻研究中心集刊(2)》,北京燕山出版社,2001]、王輝《秦曾孫骃告華大山明神文考釋》(《考古學報》第2期)先后就此作了較為深入的研究。此外,古文字資料中的語法問題也是一個學術熱點。張玉金《甲骨語法學》(學林出版社,2001)、陳年福《甲骨文動詞詞匯研究》(巴蜀書社,2001)等專著出版,極大地推進了古文字學的語法研究。還有一些論文與此有關,如張玉金《甲骨金文中“其”字意義的研究》(《殷都學刊》第1期)、劉青《甲骨文句型的轉換和衍生》(《殷都學刊》第1期)、趙誠《金文的“者”》(《中國語文》第3期)、董琨《郭店楚簡〈老子〉異文的語法學考察》(《中國語文》第4期)都非常注意從語言學尤其是語法學的角度來看待問題,所以與多數古文字學考釋成果迥然不同。此外還有一些論文值得關注。郭小武《古代漢語極高頻字探索》(《語言研究》第3期)用電腦分析古漢語典籍中的字頻,為古漢語研究開辟了一個新的途徑。劉曉明《符箓與古文字的釋讀》(《學術研究》第3期)把符箓與古文字研究聯(lián)系起來,開拓了古文字學的研究視野。鄭振鋒《論甲骨卜辭中的假借現象》(《廣西師范大學學報》第3期)分析了甲骨文研究中廣泛存在的假借現象。古漢語訓詁學和詞匯學的研究同樣稍嫌零碎,從宏觀著眼的論著不多。訓詁學比較集中討論的問題是漢語詞源問題,而詞匯學研究則主要集中在中古領域,上古漢語的詞匯學研究創(chuàng)見較少。比較集中反映了訓詁學和詞匯學成果的主要有以下幾部專著,如宋永培《〈說文〉與上古漢語詞義研究》(巴蜀書社,2001)、孟蓬生《上古漢語同源詞語音關系研究》(北京師范大學出版社,2001)、伍宗文《先秦漢語復音詞研究》(巴蜀書社,2001)、劉興均《〈周禮〉名物詞研究》(巴蜀書社,2001)、徐興?!丁磸V雅疏證〉研究》(江蘇古籍出版社,2001)。第一屆漢語詞源學會的論文集《漢語詞源研究》第1輯(吉林教育出版社,2001)對于漢語詞源研究的深入有所推動。本年度訓詁學和詞匯學的有關論文缺乏熱點,零星考釋多而系統(tǒng)論述少,而且真正值得關注的成果不多,只有王寧《關于漢語詞源研究的幾個問題》(《古籍整理研究學刊》第1期)、孫雍長《論聲訓的性質》(《徐州師范大學學報》第5期)、周寶宏《上古漢語詞義是上古文獻寫成時代的重要依據:以產生時代分歧最多的〈堯典〉為例》(《古籍整理研究學刊》第4期)等少數幾篇,多數論文具體而細微,缺乏理論高度。而且不少論文方法陳舊,視野狹窄,這一不良傾向值得學術界警惕。(三)音韻學方面2001年的漢語音韻學研究概況:專著有葉寶奎的《明清官話音系》(廈門大學出版社,2001),該書全面系統(tǒng)地考察研究了近代漢語明清音,所論及的明清音代表資料,有《洪武正韻》、《四聲通解》、《等韻圖經》,藏于倫敦的《羅馬字官話新約全書》、藏于臺北的《諧聲韻學》。作者在充分占有材料的基礎上,對明清官話音作了較為精細的分段描寫,將明音和清音分別描述,明音、清音又各分前后兩個階段。該書描述和考察了明清官話音的基本面貌及其歷史沿革,并將官話音和基礎方言代表點口語音(北音、南音)作橫向共時比較,揭示了二者的差異。作者認為,官話音既非北音也非南音,而是變化了的傳統(tǒng)讀書音,官話音與北音、南音同源異流,既有聯(lián)系又有區(qū)別。論文有邵榮芬的《〈康熙字典〉注音中的時音反映》[《語言(2)》,首都師范大學出版社,2001],本文在對《康熙字典》中綴于反切之后的直音進行全面系統(tǒng)的整理后,認為這些注音是對當時的語音實際的真實反映,它的注音系統(tǒng)與今天的北京話基本相符,主要的區(qū)別僅有兩點:①尖團音的區(qū)別可能尚未完全消失;②入聲尚未獨立。但第二條并不可靠,因此可以說今天的北京音系在《康熙字典》時已經基本形成。臺灣學生書局出版的《聲韻論叢》第十輯收錄了臺灣地區(qū)召開的第十八屆聲韻學學術研討會的一些論文。其中有大陸學者施向東的《古籍研讀札記——漢藏比較與古音研究的若干用例》,該文運用漢藏語的比較,對古籍研讀中所遇到的若干上古語言材料判定語音、訓釋字義,揭示了在古籍研讀中運用上古音研究和漢藏對比研究成果以獲取新結論的方法和途徑,并對一些有糾紛的舊說,提出了新解。虞萬里《〈黃庭經〉用韻時代新考》把道教清派早期的主要經典《黃庭經》與漢魏晉文人用韻、早期道經韻文進行比較,確認《黃庭經》的《外景經》部分的韻例與東漢語音相符,《內景經》韻例與魏晉語音相符。另外,臺灣的音韻學家也發(fā)表了精彩的文章,竺家寧的《論上古的流音聲母》從少數民族語言及語音演變規(guī)律出發(fā)論證了原始漢語有r﹣和1﹣的對立,認為原始漢語1﹣〉上古來母1﹣〉中古來母1﹣;原始漢語gr﹣、br﹣、r﹣)上古喻母r﹣〉中古喻四。梅祖麟《現代吳語和“支脂魚虞,共為不韻”》(《中國語文》第1期)用吳語處衢片的資料說明,魚虞之別,支脂之別,還保存在吳語里。這和《切韻》序所說的“支脂魚虞,共為不韻”完全吻合。本文還把吳語的支魚虞三韻、閩語的支魚虞三韻分別作了層次分析,然后在相對應的層次中作吳語和閩語的比較。結論是:南朝江東方言的魚韻說[i?]、支韻說[ie]。潘悟云《反切行為與反切原則》(《中國語文》第2期)以《王三》的反切作為基本材料,從反切行為中總結出最基本的反切原則,對聲、韻、介音與反切上下字的基本關系做出一致性的解釋,同時從這些原則出發(fā)討論了重紐、主元音與韻目的關系、《切韻》性質,以及若干韻母的構擬等問題。金基石《尖團音問題與朝鮮文獻的對音》(《中國語文》第2期)在考察中國韻書中的有關尖團音記錄的基礎上,以《樸通事新釋諺解》(1765)、《漢清文鑒》(1776)、《重刊老乞大諺解》(1795)、《華音啟蒙諺解》和《華語類抄》(1883)等朝鮮文獻的對音資料為佐證,補充論證了近代漢語中形成j、q、x的年代問題。本文認為18世紀是尖團音合流的過渡期。張渭毅《〈集韻〉重紐的特點》(《中國語文》第3期)從《集韻》收錄《廣韻》重紐字音和折合《廣韻》以外的不同來源的重紐字音兩個方面集中考察了《集韻》重紐小韻歸字的特點,發(fā)現《集韻》在維系《廣韻》重紐辨類標準的同時,還采用了時音標準,指出《廣韻》標準占據絕對優(yōu)勢地位,而時音標準處在下風。二近代漢語研究(一)語法方面2001年近代漢語的語法研究具有下面三個顯著特點。1.研究領域進一步拓寬(1)體范疇的研究。像“著”、“了”、“過”這樣的體標記歷來是近代漢語語法研究的熱點問題,但以往的研究通常將這些體標記作為單個的體貌助詞來考察,很少有人將這些體標記放在語法范疇系統(tǒng)中來討論。楊永龍《〈朱子語類〉完成體研究》(河南大學出版社,2001)以《朱子語類》完成體為研究對象,在總結以往漢語體標記和體范疇研究成果的基礎上,理出了關于體的紛呈異說的頭緒,澄清了體與時、事件、情狀類型之間關系的各種認識,擴大了體標記的研究范圍,因而在諸多方面取得了新的突破。(2)句式和結構式的研究。句式和結構式是2001年近代漢語語法研究的重點,發(fā)表了很多有分量的成果。刁晏斌的《近代漢語句法論稿》(遼寧師范大學出版社,2001)是近代漢語語法研究的一項重要成果,作者對近代漢語的把字句、被字句、受事主語句、V1NV2句、疑問句、使動式、“名+動”結構等句式和句法結構作了比較系統(tǒng)深入的描寫分析,特別是該書的第二章“近代漢語句法研究概論”從存在問題、研究內容和研究方法等方面勾畫了一個比較完整的近代漢語句法研究框架,提出了若干值得注意的見解和觀點。張美蘭《近代漢語語言研究》(天津教育出版社,2001)對近代漢語選擇問句和近代漢語處置式的產生、發(fā)展、演變的軌跡作了比較深入的分析和描寫。此外,較有影響的論文有王文暉《近代漢語中的一種特殊把字句》(《中國語文》第4期)、徐丹《從動補結構的形成看語義對句法結構的影響——兼談漢語動詞語義及功能的分化》(《語文研究》第2期)、傅惠鈞《真性問與假性問:明清漢語選擇問句的功能考察》(《語言教學與研究》第3期)、于紅巖《淺談“拿”字處置式》(《語文研究》第3期)、趙長才《“打破煩惱碎”句式的演變與發(fā)展》(《漢語史集刊》第四輯)等。(3)構詞法研究。這方面的研究成果主要有張美蘭《近代漢語語言研究》、王云路《從〈唐五代語言詞典〉看附加式構詞法在中近古漢語中的地位》(《古漢語研究》第2期),祖生利《〈景德傳燈錄〉中的補充式復音詞》(《渭南師范學院學報》第3期)和《〈景德傳燈錄〉中的支配式和主謂式復音詞淺析》(《西藏民族學院學報》第1期)等。(4)語言接觸狀態(tài)下的語法演變研究。李崇興《元代直譯體公文的口語基礎》(《語言研究》第2期)、祖生利《元代白話碑文中方位詞的格標記作用》(《語言研究》第4期)和陳宗振《試釋李唐皇室以“哥”稱父的原因及“哥”“姐”等詞與阿爾泰諸語言的關系》(《語言研究》第2期)等論文比較明顯地反映了這一研究視角。2.研究視野進一步擴大2001年的近代漢語語法研究特點還體現在研究視野的進一步擴大,史的觀念增強,研究的范圍逐漸擴展到中古漢語。這方面代表性成果是蔣紹愚《〈世說新語〉〈齊民要術〉〈洛陽伽藍記〉〈賢愚經〉〈百喻經〉中“已”“竟”“訖”“畢”》(《語言研究》第1期),俞理明《〈太平經〉中非狀語地位的否定詞“不”和反復問句》(《中國語文》第5期)以及高玉花《中古漢語副詞語義指向分析》(《古漢語研究》第2期)等。3.理論和方法的探索進一步加強很多論著不再滿足于近代漢語語法現象的靜態(tài)描寫,而力求運用現代語言學理論和方法對語法演變現象進行動態(tài)解釋。楊永龍的《〈朱子語類〉完成體研究》借鑒西方語言學中體范疇研究的理論和成果對漢語完成體范疇系統(tǒng)和特征作了比較清晰的刻畫,并成功地解釋了完成體標記的句法、語義和話語功能。張美蘭《近代漢語語言研究》從結構、語義、語用等視角對處置式的演變過程和動因作了理論上的闡發(fā)。徐丹《從動補結構的形成看語義對句法結構的影響——兼談漢語動詞語義及功能的分化》從V2的語義及功能的分化考察動補結構的產生和體標記的形成,從而突破了以往單純從句法結構角度討論研究動補結構的局限。(二)詞匯方面詞語解釋繼續(xù)有較多的文章發(fā)表,對《六度集經》、《觀世音應驗記》、《祖堂集》、《景德傳燈錄》、《醒世姻緣傳》都有詞語考釋的文章。同時也出現了一些系統(tǒng)、規(guī)律性的歸納與總結。比如陳秀蘭《敦煌變文與漢語常用詞演變研究》(《古漢語研究》第3期)、唐莉《近代漢語詞語發(fā)展的更替現象》(《古漢語研究》第4期)等。三現代漢語語法研究2001年的現代漢語語法研究,一個突出的特點就是進一步與國際語言研究的主流興趣點相吻合。國際上語法研究中形式語法學派是主流,幾十年來理論模式幾經變化,日漸成熟;與此同時,認知一功能學派的語法研究也得到了廣泛的認可,其理論和方法顯示了強大的生命力。國內的語法研究在接受形式語法方法方面經歷了一個并不順暢的歷程,而功能語法自20世紀80年代末期以來發(fā)展則比較快。可喜的是,進入21世紀以來,形式語法和功能語法在漢語研究中都得到了實質性的發(fā)展,形成了齊頭并進的局面。袁毓林《語言學研究的現狀和發(fā)展趨勢》(《漢語學習》第3期)一文,簡要回顧了20世紀語言學在研究范式上的兩次轉變,從事實描寫與理論解釋、解釋語言現象的形式主義取向與功能主義取向、語言研究的理論追求與應用目標等方面,展示了當代語言學的不同流派在語言研究的理論目標、研究方法、研究范圍和研究成果上的差別,進而從宏觀上展望語法研究的發(fā)展趨勢。當代句法研究最重要的目標之一,就是對語言共性的揭示。語言類型學家所歸納出的“主—賓—動”、“主—動—賓”、“動—主—賓”等語序類型,其間有沒有共同的結構上的原因?這是個富于挑戰(zhàn)性的課題。李亞非《多變的語序、統(tǒng)一的詞組結構》(《中國語文》第1期)一文,面對漢語、德語、英語、日語等不同核心詞位置類型的語言,采用相對的詞組定義,結合動詞移動的理論,試圖證明核心后置是一切語言的基本結構,從而不再孤立地看待詞序問題,而是循著每種語言各異的詞法形態(tài)而理解多變的語序的。馬道山《從特殊疑問句的生成語法研究看自然語言的類型》(《現代中國語研究》第3期)則關注于另一個句法學界廣為關心的問題——特殊疑問句的生成問題,作者針對以往學者提出的“在沒有疑問詞移位的語言中移動疑問詞”論斷,提出漢語特殊疑問句中標句詞的中心語特征具有很弱的疑問特征,因此疑問詞并不需要移位的假設,并在此基礎上依指示語的不同把自然語言劃分為四類。形式句法除一些長期熱點話題的深入討論外,近年來也逐漸拓展出一些新的領域,對語用成分的形式化考察就是很引人注目的一個方面。“焦點”、“話題”這樣的概念原來只是以語用學理論為基礎的功能語法學者較多使用的概念,但它們在句法層面上的作用卻無法回避,因此,從句法特征上研究焦點與話題成了形式學派學者的一個新的興趣點。徐烈炯《焦點的不同概念及其在漢語中的表現形式》(《現代中國語研究》第3期)一文運用當代語言學中關于焦點的理論考察漢語的焦點問題,首先理清了信息焦點、對比焦點、語義焦點和話題焦點等基本概念以及句法驗證方式,進而討論了重音、語序和焦點標記等有形的手段,尤其值得注意的是文章論述了焦點算子關聯(lián)以及其浮動現象。通過這種種形式角度的考察,令人信服地說明:焦點的表達本質上是在句法允許的條件下,為了有效地傳遞信息而做的語言信息包裝。焦點敏感算子的提出,啟發(fā)我們重新審視以往語法研究中未能準確定性的一些成分,尤其是某些語氣副詞。劉丹青、唐正大《話題焦點敏感算子“可”的研究》(《世界漢語教學》第3期)從概念辨析和語料考察兩個方面論證了副詞“可”作為話題焦點敏感算子的身份,給副詞研究提供了新的觀察視角。句法觀念結合漢語事實必然引出更深入的思考。馮勝利的韻律句法和韻律詞法理論就是使?jié)h語事實在普遍語法框架中得以合理解釋的嘗試。通過多年的探索,馮勝利確信韻律必須視為語言中相互作用的諸多層面里的一個獨立的層面;漢語復合詞的形式標記就是音步,就是由音步決定的韻律詞。在《韻律詞與科學理論的構建》(《世界漢語教學》第1期)一文中,他從總體上論述了“右向構詞、左向造語”的規(guī)律;在《從韻律看漢語“詞”“語”分流之大界》(《中國語文》第1期)一文中,通過四種“動補”形式的分析論證了漢語復合詞直接受制于韻律的事實;在《論漢語“詞”的多維性》(《當代語言學》第3期)一文中,則辨析了韻律詞、句法詞和詞匯詞的理論依據和實踐基礎,提倡從多維的角度觀察漢語詞語現象。此外,具有明確句法理論意識的漢語語法研究成果還有:徐杰《普遍語法原則與漢語語法現象》(北京大學出版社,2001)一書運用原則和參數的思想探討漢語的被動式、雙賓語式、主語、話題、焦點、疑問范疇等現象;沈陽、何元建、顧陽合著的《生成語法理論與漢語語法研究》(黑龍江教育出版社,2001)一書分別運用生成語法的結構理論、移位理論、論元理論和指稱理論,詳細討論了漢語語法中二十幾個專題。這兩部專著的出版顯示了形式句法理論在漢語研究中的巨大潛力。值得注意的同類文章還有:顧陽、沈陽《漢語合成復合詞的構造過程》(《中國語文》第2期)、曹逢甫、林麗卿《橫看成嶺側成峰——以漢語難字結構為例談句法與構詞之間的關系》(《現代中國語研究》第2期)、李大勤《“關系化”對“話題化”的影響》(《當代語言學》第2期)、司富珍《漢語“都”字句里的多重特征核查》(《現代中國語研究》第3期)。語言類型學的研究是漢語語法學界的薄弱點,也是亟須加強的一種理論意識。劉丹青的《漢語給予類雙及物結構的類型學考察》(《中國語文》第5期)一文采用跨語言跨方言比較的類型學方法考察漢語給予類雙及物結構幾種句式的句法性質和各自的標記性程度,分析了幾種句式各自的話語特點和認知特點,特別值得注意的是探討了制約雙及物諸句式的若干普遍性原則,排出了不同原則互動時的優(yōu)先序列。劉丹青《漢語方言的語序類型比較》(《現代中國語研究》第2期)一文則從宏觀上討論了漢語小句基本結構中話題、主語、賓語和動詞之間的語序問題。文章結合漢語的歷史變化、其他民族語言的影響以及共時語法化等因素,分別討論了普通話、吳語、閩語、粵語等方言的語序類型特點,為漢語方言語序類型的比較構建了一個新的框架。類型學的視點對漢語中普通的語法事實有深化認識的作用,陸丙甫《從賓語標記的分布看語言類型學的功能分析》(《當代語言學》第4期)通過跨語言的對比分析,討論了賓語形式標記的分布共性、賓語標記在不足使用和過度使用上的共同傾向,從功能角度做出了解釋。認知語法的研究進一步深化。沈家煊《跟副詞“還”有關的兩個句式》(《中國語文》第6期)一文集中討論跟副詞“還”有關的兩個句式,說明其中的“還”具有“主觀”和“元語”的性質,說話人用它表明自己對一個已知命題的態(tài)度,即認為這個命題提供的信息量不足,同時增補一個信息量充足的命題。文章的目的是要提示一個重要的句法一語義事實:元語和非元語用法、主觀和客觀表達的區(qū)別在語言中具有普遍性。古川?!锻饨缡挛锏摹帮@著性”與句中名詞的“有標性”——“出現、存在、消失”與“有界、無界”》(《當代語言學》第4期)用認知語言學的“顯著性原則”解釋漢語名詞前數量詞的隱現規(guī)律;張伯江《被字句和把字句的對稱與不對稱》(《中國語文》第6期)用句法臨摹性原理解釋“把/被”句中結構對稱與不對稱所反映的直接使因與間接使因、直接影響與間接影響規(guī)律;郭繼懋、王紅旗《粘合補語和組合補語表達差異的認知分析》(《世界漢語教學》第2期)也是認知原則解釋語法現象的成功例證,文章用凸顯程度的不同解釋了兩種補語在表達上的差異,進而說明了兩種補語的語義差異:規(guī)約性結果與偶發(fā)性結果。功能語法方法仍然顯示了在漢語中的廣泛適用性。陶紅印《“出現”類動詞與動態(tài)語義學》(《現代中國語研究》第2期)一文提出了一種新的思考:如果我們相信絕對同義詞并不存在的話,那么,什么才是辨識同義詞的最佳辦法?文章例示了利用現代語料庫語言學方法定量考察詞語組合格式意義的方法,通過三個“出現”類動詞的實際考察,說明了功能語言學“動態(tài)語義學”的觀點。杉村博文《“我妹妹”和“我的妹妹”的位置》(《現代中國語研究》第2期)不滿足于前人簡單地用句法像似原則解釋兩個詞組里“的”字的隱現規(guī)律,而是從篇章環(huán)境的依賴性角度證實了不帶“的”的格式的篇章依賴性以及“的”字的語義關系凸顯作用。張誼生《“N”+“們”的選擇限制與“N們”的表義功用》(《中國語文》第3期)一文從音節(jié)、語義、語用三個方面揭示了名詞+“們”的種種選擇限制,探討了“們”附在通用與專用、指人與指物等不同的名詞之后所具有的各種表義功用,以證明漢語“們”不是復數語法標志,更多起的是語用作用。鄒韶華《語用頻率效應研究》(商務印書館,2001)盡管是多年相關探討的總結,卻恰恰吻合了當代功能語言學重視語頻效應的觀念?,F代語言學的根本問題之一便是形式與意義的關系問題,也就是語義在形式上的映現如何得到推導和證明的問題。漢語語法學者多年來在這方面孜孜以求,許多傳統(tǒng)難題獲得了新的解決途徑。袁毓林《述結式配價的控制—還原分析》(《中國語文》第5期)針對述結式配價跟其構成成分的配價之間沒有直接對應關系的事實,分析了造成不對應現象的原因,著重討論了述結式論元整合的三種類型:并價、削價、共價,通過引入述結式表示的使動關系的層級和述結式的論元指稱等概念,建立述結式的論元準入規(guī)則,以概括述結式怎樣對其述語動詞和補語動詞原有的論元做出選擇。郭銳《漢語詞類劃分的論證》(《中國語文》第6期)深入反思了漢語詞類劃分中的意義原則和分布原則這兩項原則的實質,指出分布是意義的外在表現,可以通過分布同意義的對應關系來推斷詞性,而分布同詞性的對應關系可以根據語法功能間的相容性及相關規(guī)則來確定,從而找到各類詞的劃分標準,使詞類劃分成為可論證的。文章最具說服力之處是計算了漢語主要語法功能的相容度,論證了分布標準的合理性。此外,如石毓智《漢語的限定動詞和非限定動詞之別》(《世界漢語教學》第2期)、譚景春《從臨時量詞看詞類的轉變與詞性標注》(《中國語文》第4期)、施春宏《名詞的描述性語義特征與副名結合的可能性》(《中國語文》第3期)等文章,或從普遍語言學概念出發(fā),或從漢語規(guī)則的實際應用出發(fā),探索了表面事實背后的語法規(guī)律實現的途徑和條件。2001年這些成果所反映出的趨勢可以預見21世紀初期若干年內漢語句法一語義研究的發(fā)展方向。四漢語方言研究新世紀的第一年,漢語方言學界也是捷報頻傳。第二屆國際吳方言學術研討會2001年3月24~25日在蘇州大學召開。會議由上海市語文學會、香港中國語文學會和蘇州大學(中文系、國際文化交流學院)聯(lián)合舉辦。出席會議的海內外學者110人,宣讀論文80篇。論文涉及吳語研究的各個方面,反映了研究者共同關心的若干焦點,標志著吳語的研究有了顯著的進步。HNC與語言學研究研討會2001年4月8~10日在武漢華中師范大學舉行。HNC是“概念層次網絡理論”的英文縮寫,是自然語言處理的理論和系統(tǒng)。這次會議由華中師范大學語言與語言教育研究中心和中國科學院聲學所知識創(chuàng)新基地語言語音及交互信息技術部共同主辦的。其目的是加強不同學術思想的交流,增進語言學和自然語言處理領域之間的了解,推進語言新興產業(yè)的發(fā)展。全國人大副委員長許嘉璐打電話來表示祝賀。中國社會科學院語言研究所方言研究室副主任周磊博士就中國社會科學院院重大課題《自然口語語料庫》中《漢語方言自然口語語料庫建庫的若干問題》向大會作了報告,闡述了方言研究這一傳統(tǒng)語言學科在今天如何和信息產業(yè)結合的實踐和理論?!皢柷堑们迦缭S,為有源頭活水來”。漢語言的機器識別工程想要離開對漢語方言的深入研究和漢語方言自然口語語料庫的建立是根本不可能實現的。中國社會科學院語言研究所承擔的院重大課題“現代漢語方言自然口語語料庫”,在眾多學者的努力下,已經完成了漢語方言普通話10個方言代表點的建庫工作,2000位發(fā)音人的語音文件和文字文本都已順利入庫。方言自然口語語料庫的工作正在緊鑼密鼓地展開,不久的將來漢語方言自然口語語料庫就會呈現在語言研究者的面前。近年來,漢語方言學界和民族語言學界,不斷有專家學者呼吁通過某種渠道,加強兩個學科的密切聯(lián)系。為此《方言》編輯部邀請在京的漢語方言學界和民族語言學界的部分專家學者,在中國社會科學院學術報告廳召開了“漢語方言和少數民族語言研究座談會”,共同商討兩個學科互相結合的有關問題。出席座談會的專家分別來自中國社會科學院語言研究所和民族研究所、北京大學、中國人民大學、中央民族大學、北京師范大學等研究機構和高等院校。中國社會科學院語言研究所方言研究室主任、《方言》雜志主編張振興教授,方言研究室副主任周磊博士分別主持了座談會。語言研究所所長沈家煊、副所長董琨相繼指出,如何把漢語方言研究和少數民族語言研究結合起來,這是一個非常有意義的問題,也是一個發(fā)展趨勢,是進一步發(fā)展中國語言學研究的突破口之一。漢語方言學工作者迎來了本世紀的第一個方言學界的盛會——全國漢語方言學會第十一屆學術研討會。此次年會于2001年10月9~13日在陜西省西安外國語學院舉行。來自全國各省市自治區(qū)、香港特別行政區(qū)的學會會員,以及國外的專家學者共200多人參加了大會。提交大會的論文有170篇。會議就百年來漢語方言研究的回顧與新世紀研究的展望、漢語方言語法研究、漢語方言和少數民族語言比較研究等重要學術問題展開了熱烈的討論。會議期間舉行了學會理事會會議。理事會審議通過了68位申請者為全國漢語方言學會新會員。本屆年會選舉了新一屆理事會,新理事會由24名理事組成,會長熊正輝,秘書長周磊。臺灣省保留理事一名。第十二屆年會將于2003年在貴州省貴陽市舉行。第七屆雙語雙方言(國際)學術研討會,于2001年7月1~7日分兩個階段分別在深圳西麗湖度假村、澳門理工學院分別舉行。出席本屆研討會的專家學者80多人,提交論文70多篇,涉及雙語雙方言的理論和實際的各個領域,包括語言接觸和語言文化交流、少數民族地區(qū)的雙語雙方言、澳門的雙語問題和社會語言生活等各個方面。第七屆閩方言國際研討會于2001年11月3~5日在廈門大學召開。本屆研討會由廈門大學人文學院、香港科技大學人文社會科學院和香港中文大學吳多泰中國語文研究中心聯(lián)合主辦。來自世界各地的專家學者70多人出席了本屆研討會,收到論文60多篇。本屆研討會開幕式由張雙慶教授主持,廈門大學鄧力平副校長在開幕式上作了熱情洋溢的講話。第八屆國際粵方言研討會2001年12月21~24日在廣州暨南大學舉行。由廣州暨南大學漢語方言研究中心和廣東省中國語言學會聯(lián)合主辦,香港大學語言學系和香港中國語文學會協(xié)辦,詹伯慧教授為會議召集人。出席會議并宣讀論文的有來自國內外的104名專家學者。本次會議共宣讀論文102篇。內容涉及粵方言研究的各個領域。廣州暨南大學漢語方言研究中心和香港大學語言學系共同建立粵方言研究網站的項目開始啟動。第一階段內容有:①粵方言研究目錄索引;②粵方言重要著作提要;③粵方言研究評述;④粵方言研究學者簡介?!斗窖浴冯s志在2002年共發(fā)表論文和報道48篇。其中綜述和理論研究的有12篇,占25%,方言語音研究的有10篇,約占21%,方言語法研究的有11篇,約占23%,方言詞匯文字研究的有4篇,約占8%,各類語言學術會議報道的有10篇約占21%,少數民族語言和方言比較研究的1篇約占2%。從《方言》雜志所發(fā)表的研究文章的比例來看,方言理論和綜述性文章以及方言語法研究的文章所占比例都比較高,說明方言研究在語法和理論方面越來越引起學者們的關注。應當特別引起我們注意的是戴慶夏、傅愛蘭的《藏緬語的述賓結構——兼與漢語比較》一文(《方言》第4期),這篇文章是討論藏緬語的,同時兼論和漢語的比較,把藏緬語的研究和漢語方言研究進行比較,由此開闊我們的眼界,發(fā)現新的語言事實,不論在方法論上和研究實踐上都是有助于我國語言學研究的開拓和發(fā)展的。五語音學研究語音是人與機器之間,人與人之間進行交流的最自然的方式。用語音跟互聯(lián)網、家用電器、個人電腦等進行直接交流,以及用語音通過機器和互聯(lián)網進行人與人之間的交互是信息技術的發(fā)展趨勢之一。語音學(Phonetics)的研究對象是人類發(fā)音器官發(fā)出的各種聲音,特別是言語聲。所以,語音學是一門交叉學科,涉及語言學、聲學、心理學、生理學、計算機科學等諸多學科,還涉及人工智能、言語理解等諸多領域。近幾年,隨著語音應用技術和相關理論的發(fā)展需求,如語音識別和語音合成技術的發(fā)展,國內外掀起了對自然口語的研究熱潮。趙元任在20世紀60年代就指出,在實際的語言研究中,存在語體的差異。在口語中,語音變化多端,與連續(xù)話語相比,也有很大的差異,這是困擾言語處理的一大難題。要解決這一個難題,必須對自然口語進行多方面和多層次的分析,如從語言學方面研究口語交際的認知心理、口語語法、話語分析等等;從語音處理技術角度,研究語音合成和語音識別的算法;從語音學上來講,研究語音的韻律、音段以及韻律和句法的關系、韻律和音段的關系等等。“九五”以來,語言研究所語音室就十分關注國際上研究熱點,并積極開展?jié)h語的語音學研究,先后承擔了國家“863”高技術研究課題、國家“973”基礎研究課題、自然科學基金課題、“九五”國家社會科學重點項目、美國自然科學基金課題。目前開展的課題包括“十五”國家社會科學重點項目、國家自然科學基金項目、社科院重點項目、NOKIA研發(fā)中心的合作項目等。具體的研究課題涉及以下幾個方面。(一)口語語音特性的研究在連續(xù)語流中存在音段和超音段上的協(xié)同發(fā)音:連讀變化在音段的音色上,有元音和輔音的變化,語音學稱為“音段協(xié)同發(fā)音”;在超音段的韻律上,有聲調、重音和長度的變化。聲調的變化通稱為“連讀變調”,重音的變化有“邏輯重音”和“感情重音”,其中又可分為若干等級長度的變化,有音節(jié)的“長、短”和“節(jié)奏”的“停、延”。普通話的連讀變化多數是逆同化(通俗地說,就是后面的影響前面的),少數是雙向同化,極少是順同化(通俗地說,就是前面的影響后面的)。通過研究,我們發(fā)現每個音節(jié)的聲調在不同語句中的變化很大,而且語句中每個音節(jié)的聲調同它的本調也有很大差異。語音合成系統(tǒng),只有準確合成語流中的聲調變化,才能合成出自然的聲音;語音識別系統(tǒng)則可以通過變調規(guī)律,利用韻律信息,提高識別率。對自然口語的語音研究具體包括以下幾個方面。(1)韻律研究:包括對自然話語的韻律結構、重音結構和基頻F0變化模式的研究。(2)音段音變研究:對自然話語中出現的音變現象(如減音、增音、同化、濁化等)進行聲學分析和聽辨,分門別類地做出統(tǒng)計,考察它們與語句輕重音、停頓等韻律特征的關系,給出它們的產生條件和規(guī)律。此外,對不同發(fā)音人之間的音變現象進行比較,發(fā)現他們之間的共性和個性。①對具有代表性的部分語料進行細致的標注。②對語音音段變化在語料庫中的分布概況,從標注和研究中給出基本分布的統(tǒng)計結果。③對連續(xù)話語中的濁化現象的認識和解釋。聲母的濁化比較多,其出現與哪些因素有關,如何對其進行解釋。④對語音變化與韻律、句法關系的研究。韻律詞或短語內與邊界上音色的變化問題。(3)韻律和句法關系的研究:一是通過語料庫標注,為將來大規(guī)模更深入的考察創(chuàng)造基礎,二是對前人零星涉及做一個比較專門的系統(tǒng)的研究,三是進行定量的統(tǒng)計分析,考察韻律和句法之間的關系,為韻律分析提供依據。完善句法標注體系,加大語義和語用信息的標注,是下一步語料庫建設以及韻律結構與句法結構關系研究的重要步驟。(二)口語和朗讀語音的差異研究朗讀話語和自然口語的差異,不僅表現在語音上,而且表現在語言學和副語言學等朗讀話語和自然口語在韻律方面的差異方面。在語音方面,不僅韻律特征差異大,而且音段音變差異也很大。比如我們請發(fā)音人WJC,按照他自然口語記錄的語句朗讀一段話,測量在朗讀和自然口語兩種情況下它的主要韻律短語的基頻F0最大值和最小值的變化情況。我們發(fā)現自然口語的短語的基頻變化范圍比朗讀大;自然口語基頻上限的變化比朗讀話語基頻下限的變化更大;自然口語的基頻范圍可以很寬,也會變得很窄。而朗讀話語的基頻變化相對穩(wěn)定。(三)語音語料庫建設和標注研究語料庫建立、收集和標注的目的是為語音基礎研究和應用技術提供可靠的數據。我們從“七五”以來,不斷收集各種口語語音語料,并進行音段、韻律和語言學信息標注。我們提出了適合言語的韻律標注系統(tǒng)C-TOBI,以及音段標注系統(tǒng)SAMPA-C,這兩個系統(tǒng)對朗讀和自然口語的標注都適用,而且在我們承擔的美國自然科學基金支持項目、國家社科基金支持項目、NOKIA合作項目中,他們得到了實際應用并被不斷完善。語料庫自動標注技術研究,是我們提高標注速度,提高語料庫使用效率的關鍵。自然口語的韻律和音段自動標注,是我們“十五”的目標之一。(四)功能語調的語音學和聲學特性研究為了對口語交際中的各種語氣和語調進行合成,必須利用自然口語庫的語料,進行幾類重點口語功能語調的研究。(五)語音的多模態(tài)數據庫和多模態(tài)研究包括諸如從語音生成研究中所提取的各類圖像、圖形和數據,也包括各種副語言的材料,如面部表情、唇形模型、肩部和手的動作等。這項研究不僅能夠促進言語產生機理的研究,更可用于新的語音合成和識別技術的研究。六計算語言學和自然語言處理研究(一)概況自然語言信息處理的任務是對語言的字、詞、句、篇章的語音形式和書面形式進行輸入、輸出、統(tǒng)計、檢索、識別、分析、理解和生成。研究的核心問題是語言的自動理解(LanguageUnderstanding)和自動生成(LanguageGeneration)。前者要從句子表層的詞語符號串識別句子的句法結構和語義結構,最終弄清句子表達的意思;后者從要表達的意思出發(fā)選擇詞語,構造句子各個成分之間的語義結構和句法結構,最終造出符合語法和邏輯的句子。所以,計算語言學理論的任務是描述和解釋自然語言的現象和規(guī)律,建立形式化的語言模型,并且提供相應的算法,使其得以在計算機上實現。自然語言處理的應用目標是使人與計算機之間用自然語言進行交流。具體說是建立各種處理自然語言的計算機應用軟件系統(tǒng),譬如:機器翻譯、自然語言理解、計算機輔助教學、自動校對、文字自動識別、語音自動識別和合成、智能信息檢索、文獻自動分類、自動文摘,還有文本中的信息提?。◤奈谋举Y源中的非結構化信息得到結構化信息)、網上智能搜索引擎,以及各種電子詞典和術語數據庫。一般來說,科學研究轉化為產品的過程是從理論研究、應用研究到應用技術。在我國的語言處理領域,人們也一直向往著能從某種語言理論衍生出相應的處理漢語的應用系統(tǒng)。然而,由于學科發(fā)展的局限性和漢語本身的復雜性,目前的計算語言學理論和方法還不能為漢語應用系統(tǒng)提供必要的支持。另一方面,隨著互聯(lián)網的廣泛普及,語言信息處理的社會需求越來越大,人們迫切需要用自動化的手段處理海量的語言信息資源。所以近年來,國內計算語言學和自然語言處理學科發(fā)展的特點之一是,應用研究和開發(fā)的目標比較明確,投入相對較多,而基礎理論的研究則相對薄弱。2001年國內本學科的研究情況和發(fā)展態(tài)勢依然如此。在上述各種應用目標中,研究力量比較集中的項目有:文本信息檢索、文獻自動分類、自動文摘、語音自動識別與合成、機器翻譯,還有文本信息提取和過濾。另外,2001年關于語言資源的建設和語料庫的標注,以及基于語料庫的語言分析方法等研究項目也比較值得關注。下面先介紹應用系統(tǒng)研制的情況,然后談談語言資源建設方面的進展。至于語言信息處理的基礎研究,似乎還需要一段時間靜觀其發(fā)展。(二)自然語言處理應用系統(tǒng)的研制文本信息檢索和文本信息提取是2001年最有代表性的自然語言處理應用系統(tǒng)。(1)早期的文本信息檢索(InformationRetrieval,簡稱IR)系統(tǒng)是基于自由關鍵字和布爾模型的,語言處理技術的含量不高,雖然實用,但檢索效果并不很理想。近年發(fā)展起來的基于自然語言處理的文本檢索技術,到2001年已經達到了能夠處理大規(guī)模開放文本的實用程度。其中采用的語言處理技術有:自動分詞,詞頻統(tǒng)計,識別“有效詞”和“停用詞”,識別復合短語、專有名詞和未定義詞,在此基礎上用概率統(tǒng)計的方法計算文本的類別特征值,判斷檢索結果的相關程度。與此同時,文本自動分類和自動文摘技術也被引入到檢索系統(tǒng)里,以提高檢索的效率和準確度。特別值得注意的是,文本信息檢索與機器翻譯結合,形成了跨語言信息檢索(Cross-languageIR)的研究方向(用某一種語言提出檢索要求,計算機在其他語種的文本中檢索,得到的檢索結果可以翻譯成用戶指定的語種)。國際上文本檢索領域有一個最具權威的評測會議:每年一次由美國國家標準技術局和國防部高級研究計劃局組織的文本檢索會議(TREC)。它不僅提供了含有規(guī)范的大規(guī)模語料的標準文檔庫,還提出了一套比較科學的測試評價方法,其評測項目也代表了新的研究方向。2001年的評測項目包括:網頁檢索、問題回答、文本過濾、跨語言檢索、查詢處理、交互檢索和語音文本檢索。中國有研究項目參加了評測,在文本過濾和跨語言信息檢索兩個項目中的排名位于前列。(2)文本信息提取(InformationExtraction,簡稱IE)是近年來自然語言信息處理領域里發(fā)展最快的面向網絡的技術之一。與文本信息檢索以提供文檔為目標不同,文本信息提取要在更多的自然語言處理技術支持下,把需要的信息從文本中提取出來,再用某種結構化的形式組織起來,提供給用戶(人或計算機系統(tǒng))使用。信息提取技術一般被分解為五個層次:第一是專有名詞(NamedEntity),主要是人名、地名、機構名、貨幣等名詞性條目,以及日期、時間、數字、郵件地址等信息的識別和分類;第二是模板要素(TemplateElement),指應用模板的方法搜索和識別名詞性條目的相關信息,這時要處理的通常是一元關系。第三是模板關系(TemplateRelation),指應用模板的方法搜索和識別專有名詞與專有名詞之間的關系,此時處理的通常是二元關系。第四是同指關系(Co-reference),要解決文本中的代詞指稱問題。第五是腳本模板(ScenarioTemplate),是根據應用目標定義任務框架,用于特定領域的信息識別和組織。自然語言處理研究是信息提取技術的基礎。在現有的自然語言處理技術中,從詞匯分析、淺層句法分析、語義分析,到同指分析、概念結構、語用過濾,都可以應用在信息提取系統(tǒng)中。譬如,對專有名詞的提取多采用詞匯分析和淺層句法分析技術;識別句型(如SVO)或條目之間的關系需要語義分析和同指分析;概念分析和語用過濾可以用來處理事件框架內部有關信息的關聯(lián)和整合。隨著對信息的發(fā)掘由淺到深,信息提取的實際應用也從改進搜索引擎、自動問答系統(tǒng)到各種信息的圖示化表達(Visualization),逐漸增多。(三)漢語書面語語料庫和語言知識庫的建設(1)幾年來各種類型的漢語語料庫的建設在國內一直很受重視。國家重點投資的“現代漢語通用語料庫”在持續(xù)了一段生語料狀態(tài)后,從2001年開始對其1000萬字的核心語料進行標注加工?!度嗣袢請蟆窐俗⒄Z料庫也在這一年正式發(fā)布了1998年前半年共1300萬字的語料。還有一些面向特定研究目標的專用語料庫已經建成或者正在建設之中。譬如用于漢語語法研究的平衡語料庫,規(guī)模一般在200萬~300萬字。這些語料庫標注的基本都是詞語切分和詞類的信息。人們通常認為,在這些信息的基礎上應用統(tǒng)計語言模型的方法,可以得到詞語搭配、語句結構等方面的規(guī)律。隨著對語言復雜程度的不斷認識,根據同樣的思路,又出現了含有其他標注信息的語料庫。譬如,對句子中的每個詞語,既標注它的詞匯信息和詞典給出的語法屬性,也標注它在句子中的結構和語法功能信息。還有句法樹標注語料庫(簡稱樹庫treebank)和語塊(chunk)標注語料庫(也叫短語標注語料庫),標注句子或短語內部的層次和結構信息,試圖為基于統(tǒng)計的句法自動分析模型提供訓練和測試平臺。有了語料庫,就有了統(tǒng)計語言模型和基于統(tǒng)計的語言分析技術發(fā)展的空間,這方面的研究2001年在整個學科領域里仍然是一個熱點。然而,統(tǒng)計語言模型需要建立在語言學知識的基礎上,一個語言模型能否達到比較好的處理效果,很大程度上取決于我們能為它提供什么樣的語言學知識作為參數。也就是說,計算的任務是獲取參數之間的統(tǒng)計學規(guī)律,參數才是建立模型的根本。例如目前統(tǒng)計模型方法在機器翻譯系統(tǒng)中效果不佳,其主要原因應該不是模型本身的計算能力有限,而是能夠提供給模型的關于機器翻譯的知識太少。我們目前的基礎研究還沒有發(fā)掘出足夠的語言學知識,或者是還沒有把這些知識系統(tǒng)地、結構化地組織起來。這一點對基于規(guī)則的方法來說,同樣也是亟待解決的問題。(2)語言知識庫收錄各種詞法、句法、語義以及與言語過程有關的常識信息。如果說語料庫作為建立語言統(tǒng)計模型和歸納語言規(guī)則的基礎,對語言信息處理是一種間接資源的話,那么語言知識庫就是語言處理系統(tǒng)中不可缺少的直接資源。目前國內的語言知識庫有兩種類型,一種面向特定目標,其信息收錄和結構設計要符合特定系統(tǒng)的要求;另一種是通用的,描寫常用詞語的基本詞匯和語法屬性或言語過程中的基本常識。后者的典型代表是《知網》。這是一個以漢語和英語的詞語所代表的概念為描述對象,以揭示概念與概念之間以及概念所具有的屬性之間的關系為基本內容的常識知識庫。它描述同類概念之間的關系,如上下位關系、同義關系、反義關系、對義關系、部件與整體關系、材料和成品關系、屬性和宿主關系,也描述非同類概念之間的關系,如屬性值和屬性的指向關系,事件和角色關系。這些基于知識描述的語義信息已被一些研究項目作為漢語分析和理解的資源。到2001年《知網》已經完成了更新版本的大部分工作,收錄漢語詞語的數量達到了6萬。值得一提的是,《知網》是在互聯(lián)網上公開發(fā)布的。這種網上交流的方式在國外早已有之,譬如普林斯頓大學的英語WordNet,微軟的MindNet,在歐洲有基于WordNet的EurowordNet,日本有電子辭書研究所(EDR)的日語和英語的概念詞典,還有美國HPKB(High

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論