(完整word版)現代漢語常用詞表_第1頁
(完整word版)現代漢語常用詞表_第2頁
(完整word版)現代漢語常用詞表_第3頁
(完整word版)現代漢語常用詞表_第4頁
(完整word版)現代漢語常用詞表_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(完整word版)現代漢語常用詞表(完整word版)現代漢語常用詞表(完整word版)現代漢語常用詞表現代漢語常用詞表(草案)現代漢語常用詞表(草案)

1.范圍本規(guī)范(草案)提出了現當代社會生活中比較穩(wěn)定的、使用頻率較高的漢語普通話常用詞語56008個,形成《現代漢語常用詞表》,給出了詞語的詞形。本規(guī)范(草案)可供中小學語文教學、掃盲教育、漢語教育、中文信息處理和辭書編纂等方面參考、采用。2.術語和定義2.1常用詞現代漢語普通話范疇中使用頻率高、適用范圍廣的詞語。2.2詞形本規(guī)范(草案)指詞語的書寫形式。2.3詞頻在一定數量的語料中同一個詞語出現的頻度,一般用詞語的出現次數或覆蓋率來表示。本規(guī)范(草案)指詞語的出現次數。2.4頻級同一語料調查范圍中詞頻數相同的為一個頻級。本詞表頻級統(tǒng)計分兩步:第一步形成不同類型語料庫的頻級,即原始頻級。第二步形成總語料的頻級,就是將幾個原始頻級之和再除以不同類型語料庫的數目。3.研制原則3.1詞和語兼顧原則本規(guī)范(草案)的詞語收錄,以單音節(jié)詞和雙音節(jié)詞為主。同時,根據語言使用的實際情況,也收錄一些常用的縮略語、成語、慣用語等熟語,以及表達整體概念名稱的其他固定短語。3.2系統(tǒng)性和實用性兼顧原則本規(guī)范(草案)的詞語收錄,既注意詞語的系統(tǒng)性,又注意詞語在語用中的實用性。如以表示季節(jié)為根詞的一些詞,全部收錄它的加綴詞“初春”“初冬”“初秋”“初夏”,但對于“‘晚’+季節(jié)”的詞語,只收錄“晚春”“晚秋”,未收錄“晚冬”“晚夏”;對于“‘殘’+季節(jié)”的詞語,只收錄“殘冬”未收錄“殘春”“殘秋”“殘夏”。4.《現代漢語常用詞表》(草案)說明4.1本表研制過程中,收集詞語同國家語委“現代漢語通用語料庫”核心語料庫、廈門大學的新詞語語料庫、《現代漢語規(guī)范詞典》、《現代漢語詞典》、《新華詞典》等所收詞語進行了比對,并查驗了該詞在人民網《人民日報》報系網頁以及Google網簡體中文網頁、百度網等常用網頁上的使用情況。4.2本表用來檢測詞頻的語料庫有:國家語委“現代漢語通用語料庫”中經分詞標注的4500萬字語料、《人民日報》2001年~2005年約1.35億字的分詞標注語料和廈門大學的現當代文學作品語料庫約7000萬字的語料??偣?.5億字。4.3本表共收錄常用詞語56008個,包括單音節(jié)詞3181個,雙音節(jié)詞語40351個,三音節(jié)詞語6459個,四音節(jié)詞語5855個,五音節(jié)和五音節(jié)以上詞語162個。表內條目按頻級升序排列,頻級相同的按漢語拼音音序排列。4.4本規(guī)范(草案)提供了《現代漢語常用詞表》的音序索引,按漢語拼音音序排列,同音的條目按筆畫數由少到多排列。其中,詞語的讀音只供檢索使用,不代表詞語的讀音規(guī)范。頻序號詞語1的2是3在4一5不6有7這8個9上10也11他12人13就14對15說16我17要18到19大20我們21多22把23來24等25年26兩27從28而29能30又31他們頻序號詞語32以33時34沒有35會36之37但38三39被40很41下42自己43后44中國45并46使47向48已49出50用51新52所53里54給55她56更57次58最59于60可以61可62去頻序號詞語63由64問題65小66工作67讓68其69你70這個71生活72起73這樣74天75它76高77做78家79已經80再81或82才83前84走85這些86一些87卻88二89條90位91起來92各93成頻序號詞語94什么95元96現在97社會98比99同100四101關系102名103想104如105第一106因為107該108開始109許多110內111時間112人們113今天114國家115本116點117思想118至119此120一定121如果122副123無124張125同時126需要127月128則頻序號詞語129重要130為了131日132老133就是134作135五136人民137事138認為139成為140像141北京142歷史143水144方面145情況146而且147黨148學生149每150這里151但是152孩子153可能154發(fā)生155必須156只有157外158要求159全160發(fā)現161進行162特別163因頻序號詞語164歲165得到166件167文化168分169便170同志171發(fā)展172即173日本174總175因此176對于177領導178帶179既180時候181錢182自183政府184吃185非186決定187進188還是189受190國191應該192近193美194政治195話196公司197干部198出現頻序號詞語199開200一切201研究202認識203寫204十分205十206站207之間208問209希望210快211雖然212相(xiānɡ)213美國214知道215講216大家217學校218組織219見220由于221正在222法223表示224一樣225活動226如何227教育228書229據230城市231道232藝術頻序號詞語233經濟234以及235部236影響237太238其中239學240先生241完全242連243主要244繼續(xù)245頭246革命247之后248參加249能夠250住251上海252經過253非常254低255甚至256聽257先258一直259學習260仍261辦262所以263代表264變265最后266一起267萬頻序號詞語268所有269那么270心271越272較273辦法274路275有些276未277通過278找279按280拿281解決282一般283另284經285半286強287或者288時代289手290作品291不斷292以后293關于294青年295各種296真297其他298農民299那些300余301段302有的頻序號詞語303買304根本305縣306作者307者308請309叫310感到311怎么312任何313六314表現315反316存在317然而318準備319送320約321比較322書記323愛324單位325群眾326應當327王328早329女330門331個人332座333全國334意義335花336條件337環(huán)境頻序號詞語338了解339搞340力量341不僅342目前343經驗344產生345真正346回347隊348有關349字350會議351生命352今年353努力354靠355八356市357類358共359意見360死361民族362塊363只要364文學365成功366變化367句368管369你們370指371地區(qū)372方頻序號詞語373和(hé)374項375注意376當然377達378面379坐380家庭381原因382進入383病384介紹385下來386事情387方式388首389計劃390人類391報告392世紀393方法394入395信396化397步398生399聲400圖401電話402能力403片404作用405臺406如此(略)附錄《現代漢語常用詞表(草案)》音序索引詞語漢語拼音頻序號阿爸?。猕?8137阿昌族āch?。瞑溃?0849阿斗ādǒu42632阿飛?。妯ィ?8603阿富汗?。妯矗瑷ぃ?461阿訇āhōnɡ34432阿拉伯數字?。歙。猕螅瑷矗?5937阿拉伯語āl?。猕?0476阿媽?。悫?6220阿門āmén47913阿QāQ20845阿司匹林?。蟥皎歙?0294阿嚏?。舁?4643阿姨āyí6842?。è。┄?6090啊呀āyā15418啊喲?。。?3908?。èⅲ┄?8693?。è#┄?8287啊(à)à5514?。è唬┄?175哎?。?497哎呀?。椋?456哎喲?。椋。?1815哀兵必勝?。椋猕瞑?bìshènɡ53102哀愁?。椋悖瑷?5684哀悼?。椋洙ぃ?091哀告?。楱括ぃ?6418哀歌?。楱括?0509哀號āiháo29605哀嚎?。椋瑷ⅲ?5194哀叫āijiào35031哀哭?。椋毹?1402哀憐āilián35032哀鳴?。椋悫瞑?8081哀戚?。椋瘿?6661哀泣?。椋瘿?4322哀求?。椋瘢楱?1984哀傷?。椋螅瑷。瞑?9763哀思?。椋蟥?3975哀嘆āitàn26507哀慟?。椋舁埃瞑?6377哀痛āitònɡ27828哀婉?。椋鳕#?2720哀怨?。椋酲ぃ?3209哀樂?。椋酲?0602埃?。?336埃及?。椋戗?121挨(?。椋┄。?736挨邊兒?。椋猓楱。睿?3583挨次?。椋悒?0951挨個兒?。楱括ǎ?2370挨戶?。椋瑷?7735挨肩兒?。椋辏楱。睿?6979挨近?。椋戗?6596唉(āi)?。?474唉聲嘆氣?。椋螅瑷ィ瞑?tànqì24870唉呀āiyā25872挨(ái)ái4436挨餓ái'è16362挨批áipī34907挨整áizhěnɡ37482挨揍áizòu36941皚皚ái'ái28598癌ái10793癌變áibiàn35321癌細胞áixìb?。?9156癌癥áizhènɡ6730癌腫áizhǒnɡ44071噯ǎi9372矮ǎi5267矮墩墩ǎidūndūn53103矮胖ǎipànɡ27829矮小ǎixiǎo16293矮子ǎizi22440艾ài9226艾蒿àihāo36593艾窩窩àiwōwo55566艾滋病àizībìnɡ3427唉(ài)ài4115愛ài323愛不釋手àibùshìshǒu24929愛財如命àicái-rúmìnɡ54115愛稱àichēnɡ46662愛答不理àid?。猕矗歙?2602愛戴àidài11712愛爾蘭ài'ěrlán6977愛撫àifǔ19330愛國àiɡuó2338愛國主義àiɡuózhǔyì3990愛好àihào5492愛河àihé36942愛護àihù5862愛將àijiànɡ34908愛克斯光àikèsīɡu?。瞑?5082愛憐àilián23303愛戀àiliàn22255愛美àiměi21216愛面子àimiànzi31481愛莫能助àimònénɡzhù31595愛慕àimù18550愛女àinǚ29712愛情àiqínɡ2005愛人àiren5519愛神àishén30357愛屋及烏àiwū-jíwū47287愛惜àixī14976愛心àixīn4350愛憎àizēnɡ24550愛憎分明àizēnɡ-fēnmínɡ33081隘口àikǒu39452礙ài10576礙口àikǒu54644礙難àinán48993礙事àishì24816礙手礙腳àishǒu-àijiǎo45495礙眼àiyǎn43825曖昧àimèi17148安?。?651安步當車?。睿猕?dànɡchē53104安插?。睿悖瑷?7587安抵?。睿洙?5796安定?。睿洙瞑?956安度?。睿洙?7830安頓?。睿洙矗?5085安放?。睿妯ぃ瞑?5202安分?。睿妯ǎ?9045安分守己ānfèn-shǒujǐ30358安撫?。睿妯?6334安好ānhǎo36594安徽?。睿瑁酲?002安家?。睿辏楱?1467安檢?。睿辏楱#?0603安靜?。睿戗瞑?113安居?。睿戗?5923安居工程?。睿戗报括瞑溃悖瑷Γ瞑?8340安居樂業(yè)ānjū-lèyè10051安康?。睿毹。瞑?2674安樂ānlè19724安樂死?。睿歙ǎ蟥?8044安樂窩?。睿歙ǎ鳕?7483安樂椅?。睿歙ǎ?4323安理會?。睿歙瑁酲?752安謐?。睿悫?6770安眠?。睿恚楱ⅲ?2861安眠藥ānmiányào21184安民告示?。睿悫瞑括ぃ铮螅瑷?5797安寧ānnínɡ6724安排?。睿皎ⅲ?13安培?。睿皎Γ?2659安貧樂道?。睿皎?lèdào46980安琪兒?。睿瘿?ér38213安寢?。睿瘿?4324安全ānquán709安全帶?。睿瘢酲ⅲ睿洙ぃ?9797安全島?。睿瘢酲ⅲ睿洙#?8994安全閥?。睿瘢酲ⅲ睿妯?8251安全感?。睿瘢酲ⅲ瞑括#?1863安全帽?。睿瘢酲ⅲ睿悫ぃ?0135安全門ānquánmén42371安全套?。睿瘢酲ⅲ睿舁ぃ?3630安全系數?。睿瘢酲ⅲ睿螅瑷?9177安然?。睿颞ⅲ?1659安如磐石ānrúpánshí55849安如泰山?。睿颞玻舁ぃ椋螅瑷。?5083安設?。睿螅瑷?2847安身?。睿螅瑷ィ?7022安身立命?。睿螅瑷ィ?lìmìnɡ27259安神?。睿螅瑷Γ?4572安生?。睿螅瑁澹瞑?2441安適?。睿螅瑷?1376安睡?。睿螅瑁酲?8897安泰āntài39037安土重遷?。睿舁?zhònɡqi?。?3584安危?。睿鳕ィ?0168安慰ānwèi3875安穩(wěn)?。睿鳕В?4568安息ānxī18762安閑?。睿楱ⅲ?5466安詳?。睿楱ⅲ瞑?2330安享?。睿楱#瞑?3609安歇?。睿楱?8045安心?。睿?180安養(yǎng)?。睿#瞑?4116安逸?。睿?8491安營?。睿瞑?6943安營扎寨?。睿瞑?zhāzhài27510安于?。睿?4930安葬?。睿ぃ瞑?7219安之若素ānzhī-ruòsù43360安置?。睿瑷?645安裝ānzhu?。瞑?200桉樹?。睿螅瑷?2345氨ān11115氨基酸?。睿戗螅酲。?5442氨氣?。睿瘿?1641氨水?。睿螅瑁酲?4573庵?。?2110庵堂?。睿舁ⅲ瞑?6088諳練ānliàn55567諳熟?。睿螅瑷?6771鵪鶉?。睿悖瑷玻?9290鞍馬ānmǎ26027鞍馬勞頓?。睿悫?láodùn48604鞍前馬后ānqián-mǎhòu44325鞍子?。睿?8627俺ǎn2677埯ǎn51701岸àn4679岸然ànrán50468按àn279按兵不動ànbīnɡ-bùdònɡ27023按部就班ànbù-jiùb?。?5179按鍵ànjiàn32346按揭ànjiē23054按理ànlǐ30787按例ànlì48995按脈ànmài52135按摩ànmó10229按捺ànnà25943按鈕ànniǔ18863按期ànqī12723按時ànshí5677按說ànshuō19355按圖索驥àntú-suǒjì39235按壓ànyā37125按語ànyǔ34909按照ànzhào634案àn1109案板ànbǎn28985案牘àndú48605案發(fā)ànfā13946案犯ànfàn20151案件ànjiàn1461案卷ànjuàn23156案例ànlì7184案情ànqínɡ11301案頭àntóu18138案由ànyóu36095案值ànzhí13209案子ànzi6523暗àn2609(略)《現代漢語常用詞表(草案)》研制報告一研制背景為給語文應用和有關政策的制定提供科學的詞匯依據,積極服務于漢語規(guī)范化、推廣普通話,積極服務于中小學語文教學、掃盲教育、漢語教育、中文信息處理和辭書編纂等工作,1998年7月國家語言文字工作委員會批準立項,成立《現代漢語通用詞表》研制課題組。該詞表作為國家已經公布的《現代漢語通用字表》等的配套規(guī)范,是我國語言文字規(guī)范化、語文教育和研究方面的基本建設項目。研制工作自1998年7月啟動,于2001年年底完成并通過了專家鑒定。鑒于5年來漢語詞語發(fā)展變化很大,研究和統(tǒng)計手段又有很大提高,為把詞表研制工作做得更加扎實完善,課題組希望對原詞表進行修訂。2005年6月教育部語信司決定在原詞表的基礎上進行修訂,此項工作由原課題組和新立項的《現代漢語通用詞量與分級》課題組合作進行,共同研制一個常用詞表。根據5年來語言發(fā)展變化的情況和對詞條增刪調整,按新的統(tǒng)計處理方法確定其常用度并以此重新排序,使之能更真實地反映我國現代漢語詞匯系統(tǒng)的概貌。這次修訂工作進行了一年半,主要是對詞語作了較大規(guī)模的增刪調整,并根據詞頻調查結果確定了使用頻級。修訂的主體工作于2007年1月完成,之后又根據有關專家和部門的意見陸續(xù)作了增補和修改。二研制過程(一)初稿的形成本詞表初稿的研制工作,主要包含下列幾方面的內容:(1)搜集有關文獻資料,研究前人制訂各種詞表的經驗和教訓;(2)比較現有的、在社會上影響較大的辭書的詞目,并研究它們的取舍標準;(3)進行社會調查,了解群眾使用漢語詞匯的具體情況;(4)在把《現代漢語規(guī)范詞典》開編時的詞目和其他10多本詞典、詞表進行對比后進行增刪的基礎上,用山西大學和清華大學計算機中心所儲存的語料進行詞匯覆蓋率的檢驗。對條目的增刪,除了利用計算機之外,還進行了人工干預,逐條審核。通過以上工作,形成了總詞目為61000多個的“詞表”。2000年2月26日在北京經專家鑒定通過。鑒定委員有陸儉明、陳章太、曹先擢、常寶儒、劉慶隆、林杏光和蘇培成,由蘇培成主持。(二)詞表的修訂2005年春天,為了加快詞表研制工作的進度和提高質量,在教育部語言文字信息管理司的組織下,研制組聯合蘇新春主持的“現代漢語通用詞量與分級”課題組對原詞表作了修訂并再次進行詞頻統(tǒng)計工作。將“詞表”同國家語委研制的“通用語料庫”的核心語料庫所收詞語進行比對。核心語料庫約有15萬多個詞語,除去專有名詞、行業(yè)詞語、人名、地名等以外,語文類詞語約10萬個。將“詞表”同這10萬個詞語進行逐一比對,按照常用詞表既定的收錄原則逐條篩選。在審慎分析各詞語在通用語料庫中詞頻的基礎上,考察社會語文生活中的實際使用情況,經過人工干預增選出約4000多個詞語。將“詞表”同《現代漢語規(guī)范詞典》、《現代漢語詞典》(第5版)、《新華詞典》等所收詞語進一步比對。排除其中的方言詞語、專有名詞、行業(yè)詞語以及現代語文生活中存活率或使用率明顯偏低的文言詞語,再按照常用詞表既定的收錄原則進行審核,增補了500多個詞語。將“詞表”同新詞語語料庫所收新詞語進行比對。利用廈門大學研制的新詞語語料庫,按照課題組既定的收錄原則進行篩選,經現代漢語通用語料庫檢測,增補了1000余個詞語。至此,“詞表”的詞語收錄總數擴展到了66000多個。對“詞表”詞語進行綜合審讀,必要時查驗了該詞在人民網《人民日報》報系網頁以及Google網簡體中文網頁、百度網等常用網頁上的使用情況,作了再次調整(主要是刪除尚不具備本表所界定的“常用”規(guī)格的詞語),另外也考慮到作為常用性詞表的詞,不宜象一般詞典那樣因語音或語法的細小差異而將詞目作過細的區(qū)分。后來在送專家和有關部門審讀中,又根據審讀意見陸續(xù)作了調整和刪減。最終形成的《現代漢語常用詞表》,收錄詞語共56008個。[1]包括單音節(jié)詞3181個,雙音節(jié)詞語40351個,三音節(jié)詞語6459個,四音節(jié)詞語5855個,五音節(jié)和五音節(jié)以上詞語162個。調查所有詞語的使用頻次。用來檢測詞頻的語料庫有三種:第一種是國家語委主持研制的“通用語料庫”中經分詞標注的4500萬字語料。第二種是《人民日報》2001年~2005年約1.35億字的分詞標注語料。第三種是廈門大學研制的現當代文學作品語料庫,約7000萬字的語料。總共2.5億字。以上三種語料均作有分詞與標注,從中獲得詞頻數據。對以下兩種情況作了人工檢測。第一種是分詞后在該語料中沒有出現的詞語。做法是將被檢詞放到未作分詞標注的原始語料中以查檢字符串的方式調出所有用例進行人工甄別,從而避免原始語料中有詞卻因軟件分詞而消失了。在查檢時對數量大的語例則用隨機抽樣的方法抽檢。第二種是同形詞。對同形異義詞在實際語例中進行人工干預,區(qū)分意義,分別統(tǒng)計詞頻。三研制原則和方法(一)收詞原則本詞表所稱的“常用詞”是指以漢語為母語的中等文化程度的人,在社會語文生活中經常見到和使用的現代漢語普通話詞語。本詞表要求給現當代社會語文生活中通用的、穩(wěn)定性較強、使用頻率較高的漢語普通話詞語劃出一個范圍,作為現代漢語詞匯系統(tǒng)的基干部分,從而為語言應用和有關語言文字政策的制訂提供科學的詞匯依據。在研制中,既注重了書面詞語的收集,也兼顧了常用口語詞語的考察,還適當收了一些在現代社會大眾傳媒中時有出現,跟語文生活有所關聯的行業(yè)性、歷史性詞語。至于更專業(yè)些的詞語將另行研制,作為《現代漢語常用詞表》的附表。本詞表以收錄單音節(jié)詞和雙音節(jié)詞為主。同時,根據語言交際實際也收錄一些使用頻率明顯較高的縮略語、成語、慣用語等熟語,以及表達整體概念名稱的其他固定短語。1.鑒于漢語詞語本身在縮略、擴展、拆用,以及跟別的詞語組合成新的固定語等方面的靈活性和復雜情況,本詞表的詞語篩選還貫徹了以下規(guī)則:(1)對于帶有詞根性質的詞語(如“群眾化”“群眾性”中的“群眾”)和它們的擴展詞形、組合短語,從詞語構成的能產性考慮,優(yōu)先收錄帶有詞根性質的詞語,對它們的擴展詞形或組合短語,根據實際使用頻度和規(guī)范狀況等有選擇地收錄,原則上雙音節(jié)者適當從寬,三音節(jié)及其以上者適度從嚴。(2)對于簡縮詞語或簡稱和它們的原形詞語,根據實際使用頻度和規(guī)范狀況等做出不同的選擇。如:“安理會”“安全理事會”“聯合國安全理事會”,收錄“安理會”,而不再收錄“安全理事會”和“聯合國安全理事會”;“福利彩票”和“福彩”,收錄“福利彩票”,而不收錄“福彩”。(3)可以拆用的四字以上的固定語(多是八字熟語),原則上收錄其完整式,而不分別收錄拆用式。如:收錄“種瓜得瓜,種豆得豆”,不分別收錄“種瓜得瓜”和“種豆得豆”。(4)經常出現的雙音節(jié)結構,如果其中一個組成語素在現代漢語中基本不單用,則把該結構視為詞加以收錄,如“烏云、李子、鯽魚、松樹”等;如果該結構中有一個成分的意義已經虛化,也視為詞加以收錄,如“達到、釀成、成為、致以、覺得”等。2.鑒于本詞表的研制目的和使用價值,對于確實存活在社會語文生活中、但較為特殊的幾類詞語,采用以下處理辦法:(1)人名。原則上不予收錄,但有比喻、借代等引申意義的,適當收錄其中穩(wěn)定而高頻的。如“阿Q”“諸葛亮”等。(2)地名。原則上不予收錄,但收錄使用頻率相對較高的我國各?。捌涫?、自治區(qū)(及其首府)、直轄市名稱,以及它們常用的別稱或簡稱。(3)國名。只收錄我國周邊國家以及在社會語文生活中出現頻率明顯較高的一些國家和城市的名稱。(4)我國各歷史朝代名稱。只收錄歷史上影響較大、在現當代社會語文生活中出現頻率明顯較高的朝代名稱。(5)黨、國家、社會團體和企事業(yè)各機構的名稱,以及這些機構的領導職務的名稱。原則上不予收錄,但在現當代社會語文生活中明顯穩(wěn)定而高頻的“支部”、有著明確比喻意義的“班長”等,則予以收錄。本詞表的詞語收錄,既注意詞語的系統(tǒng)性,又注意詞語在語用中的實用性。如以表示季節(jié)為根詞的一些詞,全部收錄它的加綴詞“初春”“初冬”“初秋”“初夏”,但對于“晚+季節(jié)”的詞語,只收錄“晚春”“晚秋”未收錄“晚冬”“晚夏”;對于“殘+季節(jié)”的詞語,只收錄“殘冬”未收錄“殘春”“殘秋”“殘夏”??傊谠~語收錄的具體操作中,盡量處理好詞語的系統(tǒng)性和詞語的常用性的相互關系,特別注意詞頻的高低,一切從語言使用實際出發(fā)。本詞表的詞語收錄,既充分尊重社會語文生活的客觀實際,又嚴格控制不符合規(guī)范以及格調低俗的詞語,切實起到促進社會語文生活向著規(guī)范、文明方向發(fā)展的積極作用。本詞表所收錄的詞語,在用字上基本涵蓋了《現代漢語常用字表》中的全部漢字,不超出《現代漢語通用字表》的范圍。凡是獨立成詞的字,列出單音節(jié)詞;不能獨立成詞的字,收錄于復音詞中。單音節(jié)詞條中包括了某些只作常用姓氏的字,如“鄧”。(二)根據“詞頻頻級排序法”確定詞語的使用頻度順序本詞表確定詞語的使用頻度順序使用的是“詞頻頻級排序法”。由于詞語的來源面比較寬,各種語料都有自己的覆蓋面與構成特點,詞表中的詞語不能在每種語料中都得到全部顯現。同一個詞語在不同語料庫中的頻次也可能相差較大,因而不同語料庫中的具體頻次之間缺乏嚴格的可比性。用頻級統(tǒng)計則能較客觀地顯示每個詞語的使用情況。頻級排序法就是同一語料庫中所有詞語按頻次數的多少進行的一種排序方法。相同頻次的為一個頻級。頻級統(tǒng)計分兩步施行。第一步形成不同類型語料的頻級。檢測語料有“通用語料庫”、“人民日報”、“文學作品”三種,這樣每一個詞語就有了三個不同的原始頻級。第二步形成總語料的頻級,就是將每個詞語的三種語料的頻級之和除以三??傉Z料的頻級共有2969級,1級為最高,2969級為最低。同一頻級的詞語最多有1781條,最少的只有1條詞語。相同頻級的詞語,根據總頻次的多少由高到低排序,相同頻次的根據讀音按字母升序排列。四研制的內容本詞表包括“頻級序號”“詞語”等內容?!邦l級序號”是根據“頻級統(tǒng)計法”排序,其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論