標(biāo)準(zhǔn)解讀

《GB/T 36452-2018 信息處理用藏文分詞規(guī)范》是中國(guó)國(guó)家標(biāo)準(zhǔn)之一,旨在為藏文的信息處理提供統(tǒng)一的分詞規(guī)則。該標(biāo)準(zhǔn)適用于藏文文本處理、機(jī)器翻譯、信息檢索等領(lǐng)域,有助于提高這些領(lǐng)域內(nèi)藏文處理的一致性和準(zhǔn)確性。

根據(jù)這一標(biāo)準(zhǔn),藏文分詞遵循一定的原則和方法。首先,在基本原則方面,強(qiáng)調(diào)了要依據(jù)語言學(xué)理論并結(jié)合計(jì)算機(jī)處理的實(shí)際需求來定義分詞單位;同時(shí)考慮到藏文書寫習(xí)慣及語法特點(diǎn),確保分詞結(jié)果能夠反映原文的意義結(jié)構(gòu)。其次,在具體操作層面,則是通過明確不同類型詞語(如名詞、動(dòng)詞等)及其組合形式(如復(fù)合詞、派生詞等)如何被切分為獨(dú)立的詞項(xiàng)來進(jìn)行指導(dǎo)。此外,還特別指出了對(duì)于一些特殊字符或符號(hào)(比如標(biāo)點(diǎn)符號(hào)),它們?cè)诰渥又械淖饔靡残枰徽_識(shí)別,并據(jù)此做出相應(yīng)的分割處理。

標(biāo)準(zhǔn)中還包含了詳細(xì)的示例部分,通過對(duì)多個(gè)實(shí)際例子進(jìn)行分析說明,幫助使用者更好地理解和應(yīng)用上述原則與方法。例如,它會(huì)展示如何將一個(gè)完整的藏語文本段落按照規(guī)定的分詞規(guī)則分解成一系列有意義的基本詞匯單元,以及在這個(gè)過程中需要注意哪些細(xì)節(jié)問題。


如需獲取更多詳盡信息,請(qǐng)直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2018-06-07 頒布
  • 2019-01-01 實(shí)施
?正版授權(quán)
GB∕T 36452-2018 信息處理用藏文分詞規(guī)范_第1頁(yè)
GB∕T 36452-2018 信息處理用藏文分詞規(guī)范_第2頁(yè)
GB∕T 36452-2018 信息處理用藏文分詞規(guī)范_第3頁(yè)
GB∕T 36452-2018 信息處理用藏文分詞規(guī)范_第4頁(yè)
GB∕T 36452-2018 信息處理用藏文分詞規(guī)范_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余15頁(yè)可下載查看

下載本文檔

GB∕T 36452-2018 信息處理用藏文分詞規(guī)范-免費(fèi)下載試讀頁(yè)

文檔簡(jiǎn)介

ICS3524001

L70..

中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)

GB/T36452—2018

信息處理用藏文分詞規(guī)范

SpecificationonTibetansegmentationforinformationprocessing

2018-06-07發(fā)布2019-01-01實(shí)施

國(guó)家市場(chǎng)監(jiān)督管理總局發(fā)布

中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)

GB/T36452—2018

目次

前言

…………………………Ⅰ

引言

…………………………Ⅱ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術(shù)語和定義

3………………1

分詞規(guī)范

4…………………1

參考文獻(xiàn)

……………………15

GB/T36452—2018

前言

本標(biāo)準(zhǔn)按照給出的規(guī)則起草

GB/T1.1—2009。

請(qǐng)注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任

。。

本標(biāo)準(zhǔn)由全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)提出并歸口

(SAC/TC28)。

本標(biāo)準(zhǔn)起草單位中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院西藏大學(xué)西北民族大學(xué)西藏自治區(qū)藏語文工作委

:、、、

員會(huì)辦公室青海師范大學(xué)青海民族大學(xué)中國(guó)科學(xué)院軟件研究所西藏自治區(qū)工業(yè)和信息化廳

、、、、。

本標(biāo)準(zhǔn)主要起草人扎西加歐珠尼瑪扎西熊濤格桑多吉多拉拉巴澤仁大羅桑朗杰高定國(guó)

:、、、、、、、、、

拉瓊?cè)是嘀Z布索南尖措旺堆小尼瑪扎西普次仁頓珠次仁趙棟材邊巴嘉措

、、、、、、、、。

GB/T36452—2018

引言

本標(biāo)準(zhǔn)以現(xiàn)代藏語的詞類和分詞研究成果為基礎(chǔ)根據(jù)藏文詞匯特點(diǎn)與構(gòu)詞規(guī)律并參考漢語分詞

,,

及詞類標(biāo)記相關(guān)標(biāo)準(zhǔn)見參考文獻(xiàn)的部分內(nèi)容規(guī)定了信息處理用藏文分詞規(guī)范

(),。

GB/T36452—2018

信息處理用藏文分詞規(guī)范

1范圍

本標(biāo)準(zhǔn)規(guī)定了信息處理用藏文分詞規(guī)范

。

本標(biāo)準(zhǔn)適用于藏文信息處理各領(lǐng)域其他行業(yè)和有關(guān)學(xué)科可參照使用

,。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的凡是注日期的引用文件僅注日期的版本適用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改單適用于本文件

。,()。

信息處理用藏語詞類標(biāo)記集

GB/T36337—2018

3術(shù)語和定義

下列術(shù)語和定義適用于本文件

。

31

.

詞word

區(qū)別事物意義的最小的語法單位

。

32

.

詞組phrase

兩個(gè)或更多詞組合成的語言單位

。

注詞組可以是實(shí)詞與實(shí)詞的組合也可以是實(shí)詞和虛詞的組合

:,。

33

.

藏文信息處理TibetaninformationprocessingTIP

;

用計(jì)算機(jī)對(duì)藏文的音形義等信息進(jìn)行處理

、、。

34

.

分詞單位segmentunit

在分詞過程中出現(xiàn)的詞

。

注分詞單位不僅限于語法詞其中也包含了信息處理所需的一部分結(jié)合緊密使用穩(wěn)定的詞組

:,、。

35

.

藏文分詞Tibetansegmentation

將連續(xù)的藏文音節(jié)序列按照一定的規(guī)范重新組合詞序列的過程

。

4分詞規(guī)范

41藏文分詞單位和詞類的標(biāo)記

.

本標(biāo)準(zhǔn)以作為藏文分詞單位的標(biāo)記藏語詞類標(biāo)記依據(jù)的規(guī)定

“/”,GB/T3633

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁(yè),非文檔質(zhì)量問題。

評(píng)論

0/150

提交評(píng)論