標(biāo)準(zhǔn)解讀

《GB/T 36337-2018 信息處理用藏語詞類標(biāo)記集》是一項國家標(biāo)準(zhǔn),旨在為藏語文本的信息處理提供一套統(tǒng)一的詞類標(biāo)記體系。該標(biāo)準(zhǔn)詳細(xì)定義了藏語中各種詞匯的分類及其對應(yīng)的標(biāo)記符號,目的是為了促進(jìn)藏語文本在自然語言處理、機(jī)器翻譯等領(lǐng)域的應(yīng)用與發(fā)展。

根據(jù)這一標(biāo)準(zhǔn),藏語詞匯被細(xì)分為多個大類,包括但不限于名詞、動詞、形容詞、數(shù)詞、量詞、代詞、副詞、介詞、連詞以及助詞等。每一類之下還可能進(jìn)一步細(xì)分,例如名詞可以進(jìn)一步劃分為普通名詞、專有名詞等子類別。每種類別都有其特定的英文縮寫作為標(biāo)記符,便于計算機(jī)系統(tǒng)識別和處理。

此外,《GB/T 36337-2018》還規(guī)定了一些特殊用途或功能性的詞匯標(biāo)記方式,比如表示語氣、時態(tài)變化等方面的詞匯也得到了明確的定義與歸類。通過這種方式,不僅有助于提高基于藏語文本的信息處理技術(shù)效率,同時也促進(jìn)了跨語言文化交流和技術(shù)發(fā)展。

該標(biāo)準(zhǔn)適用于所有涉及藏語文本自動化處理的相關(guān)領(lǐng)域,如文本分析、信息檢索、自動摘要生成等應(yīng)用場景。采用統(tǒng)一規(guī)范化的詞類標(biāo)記體系,有利于不同機(jī)構(gòu)之間共享資源和服務(wù),對于推動藏語信息化建設(shè)具有重要意義。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2018-06-07 頒布
  • 2019-01-01 實施
?正版授權(quán)
GB/T 36337-2018信息處理用藏語詞類標(biāo)記集_第1頁
GB/T 36337-2018信息處理用藏語詞類標(biāo)記集_第2頁
GB/T 36337-2018信息處理用藏語詞類標(biāo)記集_第3頁
GB/T 36337-2018信息處理用藏語詞類標(biāo)記集_第4頁
GB/T 36337-2018信息處理用藏語詞類標(biāo)記集_第5頁
免費預(yù)覽已結(jié)束,剩余23頁可下載查看

下載本文檔

GB/T 36337-2018信息處理用藏語詞類標(biāo)記集-免費下載試讀頁

文檔簡介

ICS3524001

L70..

中華人民共和國國家標(biāo)準(zhǔn)

GB/T36337—2018

信息處理用藏語詞類標(biāo)記集

Theparts-of-speechtaggingsetforTibetaninformationprocessing

2018-06-07發(fā)布2019-01-01實施

國家市場監(jiān)督管理總局發(fā)布

中國國家標(biāo)準(zhǔn)化管理委員會

GB/T36337—2018

目次

前言

…………………………Ⅲ

引言

……………………………1

范圍

1………………………1

術(shù)語和定義

2………………1

標(biāo)記符號

3…………………1

詞類標(biāo)記集

4………………1

詞類標(biāo)記集中主要詞類的特征

5…………11

詞類及標(biāo)記代碼的說明

6…………………14

參考文獻(xiàn)

……………………20

GB/T36337—2018

前言

本標(biāo)準(zhǔn)按照給出的規(guī)則起草

GB/T1.1—2009。

請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別這些專利的責(zé)任

。。

本標(biāo)準(zhǔn)由全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會提出并歸口

(SAC/TC28)。

本標(biāo)準(zhǔn)起草單位中國電子技術(shù)標(biāo)準(zhǔn)化研究院西藏大學(xué)西藏自治區(qū)藏語文工作委員會辦公室西

:、、、

北民族大學(xué)青海師范大學(xué)青海民族大學(xué)中國科學(xué)院軟件研究所西藏自治區(qū)工業(yè)和信息化廳

、、、、。

本標(biāo)準(zhǔn)主要起草人扎西加歐珠尼瑪扎西熊濤格桑多吉多拉拉巴澤仁大羅桑朗杰高定國

:、、、、、、、、、

拉瓊?cè)是嘀Z布索南尖措旺堆小尼瑪扎西普次仁頓珠次仁趙棟材邊巴嘉措

、、、、、、、、。

GB/T36337—2018

引言

本標(biāo)準(zhǔn)以現(xiàn)代藏語的詞類和分詞研究成果為基礎(chǔ)根據(jù)藏文自身的詞匯特點與構(gòu)詞規(guī)律并參考漢

,,

語分詞及詞類標(biāo)記相關(guān)標(biāo)準(zhǔn)見參考文獻(xiàn)的內(nèi)容規(guī)定了信息處理中藏語詞類標(biāo)記集

(),。

GB/T36337—2018

信息處理用藏語詞類標(biāo)記集

1范圍

本標(biāo)準(zhǔn)規(guī)定了信息處理中藏語詞類標(biāo)記集

。

本標(biāo)準(zhǔn)適用于藏文信息處理各領(lǐng)域其他行業(yè)和有關(guān)學(xué)科可參照使用

,。

2術(shù)語和定義

下列術(shù)語和定義適用于本文件

21

.

詞類partsofspeechPOS

;

依據(jù)詞的句法功能原則所劃分的類

。

22

.

分詞單位segmentunit

在分詞過程中出現(xiàn)的詞

注分詞單位不僅限于語法詞其中也包含了信息處理所需的一部分結(jié)合緊密使用穩(wěn)定的詞組

:,、。

23

.

詞類標(biāo)注POStagging

對分詞文本中的每個分詞單位標(biāo)注上詞類的過程

。

24

.

藏文信息處理TibetaninformationprocessingTIP

;

用計算機(jī)對藏文的音形義等信息進(jìn)行處理

、、。

3標(biāo)記符號

本標(biāo)準(zhǔn)中標(biāo)記符號采用英文字母漢語拼音字母及藏文拉丁轉(zhuǎn)寫字母

、。

4詞類標(biāo)記集

41名詞n

.()

表示人和事物的名稱或時間處所方位等在句中主要充當(dāng)主語和賓語

、、,。

一般名詞表示人和事物的名稱

a)(n

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論