標準解讀

《GB/T 36472-2018 信息處理用藏語短語分類與標記規(guī)范》是一項國家標準,旨在為藏語文本的信息處理提供一套統(tǒng)一的短語分類和標記方法。該標準適用于藏文自然語言處理、機器翻譯、信息檢索等多個領域,通過定義一系列術語和規(guī)則來增強不同系統(tǒng)之間的互操作性。

根據(jù)標準內(nèi)容,它首先界定了“短語”的概念,并將其按照功能劃分為名詞性短語、動詞性短語等不同類型。每種類型的短語都有其特定的結構特征及組成部分說明。此外,《GB/T 36472-2018》還詳細規(guī)定了如何對這些短語進行標注,包括但不限于使用何種符號作為分隔符、如何表示層次關系等技術細節(jié)。對于特殊情況下可能出現(xiàn)的問題,如歧義性表達或非典型結構,則提供了相應的解決方案或建議處理方式。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權發(fā)布的權威標準文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2018-06-07 頒布
  • 2019-01-01 實施
?正版授權
GB/T 36472-2018信息處理用藏語短語分類與標記規(guī)范_第1頁
GB/T 36472-2018信息處理用藏語短語分類與標記規(guī)范_第2頁
GB/T 36472-2018信息處理用藏語短語分類與標記規(guī)范_第3頁
GB/T 36472-2018信息處理用藏語短語分類與標記規(guī)范_第4頁
GB/T 36472-2018信息處理用藏語短語分類與標記規(guī)范_第5頁
免費預覽已結束,剩余11頁可下載查看

下載本文檔

GB/T 36472-2018信息處理用藏語短語分類與標記規(guī)范-免費下載試讀頁

文檔簡介

ICS3524001

L70..

中華人民共和國國家標準

GB/T36472—2018

信息處理用藏語短語分類與標記規(guī)范

SpecificationonTibetanphraseclassificationandtagging

forinformationprocessing

2018-06-07發(fā)布2019-01-01實施

國家市場監(jiān)督管理總局發(fā)布

中國國家標準化管理委員會

GB/T36472—2018

目次

前言

…………………………Ⅰ

引言

…………………………Ⅱ

范圍

1………………………1

術語和定義

2………………1

總則

3………………………1

短語類別的劃分及標記代碼

4……………1

附錄規(guī)范性附錄信息處理用藏語短語分類及標記代碼表

A()………7

參考文獻

……………………11

GB/T36472—2018

前言

本標準按照給出的規(guī)則起草

GB/T1.1—2009。

請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機構不承擔識別這些專利的責任

。。

本標準由全國信息技術標準化技術委員會提出并歸口

(SAC/TC28)。

本標準起草單位中國電子技術標準化研究院青海師范大學西藏自治區(qū)藏語文工作委員會辦公

:、、

室中國藏學研究中心青海民族大學西藏大學中國科學院軟件研究所西北民族大學

、、、、、。

本標準主要起草人才讓加吉太加熊濤華卻才讓扎洛才藏太才智杰頭旦才讓周毛先

:、、、、、、、、。

GB/T36472—2018

引言

本標準依據(jù)藏語傳統(tǒng)語法分類體系根據(jù)藏語信息處理的特點和要求按照語法功能和便于計算機

,,

自動分析和處理的原則劃分藏語短語詞類并規(guī)定了藏語短語標記代碼

,。

GB/T36472—2018

信息處理用藏語短語分類與標記規(guī)范

1范圍

本標準規(guī)定了信息處理中藏語短語的類別劃分和標記代碼

。

本標準適用于藏文信息處理各領域其他行業(yè)和有關學科可參照使用

,。

2術語和定義

下列術語和定義適用于本文件

。

21

.

藏文信息處理TibetanInformationProcessingTIP

;

用計算機對藏文的音形義等信息進行處理

、、。

22

.

短語類別phrasecategories

短語的語法分類主要是根據(jù)語法功能劃分出來的類

,。

23

.

標記tag

對文本中短語類別進行標注的代碼

。

3總則

31短語的基本范圍

.

本標準的類別特指信息處理用藏語短語類別如名詞性短語動詞性短語形容詞性短

,(NP)、(VP)、

語等

(AP)。

32短語類別劃分的原則

.

本標準針對藏語信息處理的特點和要求依據(jù)藏語傳統(tǒng)語法分類體系并參考漢語短語分類研究成

,,

果見參考文獻確定了藏文短語類別劃分原則短語大類之間不應出現(xiàn)交叉包括標注形式層和語義

(),。,

層小類間允許出現(xiàn)標注形式層交叉但不應出現(xiàn)語義層的交叉

;,。

33標記代碼的制定原則

.

依據(jù)國際通常做法標記代碼主要采用英文術語的字母例如名詞短語采用數(shù)詞采

,。,“”,NP;“”,

用作為標記代碼藏語獨有的或使用英文術語字母標記不便的依據(jù)國內(nèi)通常做法標記代碼采

MP。,,,

用漢語拼音字母如判斷性短語采用漢語拼音的首字母作為標記代碼

。,“”,PP。

4短語類別的劃分及標記代碼

41短語類別的劃分

.

本標準將藏語短語劃分為名詞性

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權,嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。驍?shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論