• 現(xiàn)行
  • 正在執(zhí)行有效
  • 2018-06-07 頒布
  • 2019-01-01 實施
?正版授權
GB/T 36452-2018信息處理用藏文分詞規(guī)范_第1頁
GB/T 36452-2018信息處理用藏文分詞規(guī)范_第2頁
GB/T 36452-2018信息處理用藏文分詞規(guī)范_第3頁
GB/T 36452-2018信息處理用藏文分詞規(guī)范_第4頁
GB/T 36452-2018信息處理用藏文分詞規(guī)范_第5頁
免費預覽已結束,剩余15頁可下載查看

下載本文檔

免費下載試讀頁

文檔簡介

ICS3524001

L70..

中華人民共和國國家標準

GB/T36452—2018

信息處理用藏文分詞規(guī)范

SpecificationonTibetansegmentationforinformationprocessing

2018-06-07發(fā)布2019-01-01實施

國家市場監(jiān)督管理總局發(fā)布

中國國家標準化管理委員會

GB/T36452—2018

目次

前言

…………………………Ⅰ

引言

…………………………Ⅱ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術語和定義

3………………1

分詞規(guī)范

4…………………1

參考文獻

……………………15

GB/T36452—2018

前言

本標準按照給出的規(guī)則起草

GB/T1.1—2009。

請注意本文件的某些內容可能涉及專利本文件的發(fā)布機構不承擔識別這些專利的責任

。。

本標準由全國信息技術標準化技術委員會提出并歸口

(SAC/TC28)。

本標準起草單位中國電子技術標準化研究院西藏大學西北民族大學西藏自治區(qū)藏語文工作委

:、、、

員會辦公室青海師范大學青海民族大學中國科學院軟件研究所西藏自治區(qū)工業(yè)和信息化廳

、、、、。

本標準主要起草人扎西加歐珠尼瑪扎西熊濤格桑多吉多拉拉巴澤仁大羅桑朗杰高定國

:、、、、、、、、、

拉瓊仁青諾布索南尖措旺堆小尼瑪扎西普次仁頓珠次仁趙棟材邊巴嘉措

、、、、、、、、。

GB/T36452—2018

引言

本標準以現(xiàn)代藏語的詞類和分詞研究成果為基礎根據藏文詞匯特點與構詞規(guī)律并參考漢語分詞

,,

及詞類標記相關標準見參考文獻的部分內容規(guī)定了信息處理用藏文分詞規(guī)范

(),。

GB/T36452—2018

信息處理用藏文分詞規(guī)范

1范圍

本標準規(guī)定了信息處理用藏文分詞規(guī)范

。

本標準適用于藏文信息處理各領域其他行業(yè)和有關學科可參照使用

,。

2規(guī)范性引用文件

下列文件對于本文件的應用是必不可少的凡是注日期的引用文件僅注日期的版本適用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改單適用于本文件

。,()。

信息處理用藏語詞類標記集

GB/T36337—2018

3術語和定義

下列術語和定義適用于本文件

。

31

.

詞word

區(qū)別事物意義的最小的語法單位

。

32

.

詞組phrase

兩個或更多詞組合成的語言單位

。

注詞組可以是實詞與實詞的組合也可以是實詞和虛詞的組合

:,。

33

.

藏文信息處理TibetaninformationprocessingTIP

;

用計算機對藏文的音形義等信息進行處理

、、。

34

.

分詞單位segmentunit

在分詞過程中出現(xiàn)的詞

。

注分詞單位不僅限于語法詞其中也包含了信息處理所需的一部分結合緊密使用穩(wěn)定的詞組

:,、。

35

.

藏文分詞Tibetansegmentation

將連續(xù)的藏文音節(jié)序列按照一定的規(guī)范重新組合詞序列的過程

。

4分詞規(guī)范

41藏文分詞單位和詞類的標記

.

本標準以作為藏文分詞單位的標記藏語詞類標記依據的規(guī)定

“/”,GB/T3633

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經授權,嚴禁復制、發(fā)行、匯編、翻譯或網絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。驍底稚唐返奶厥庑?,一經售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。

評論

0/150

提交評論