標(biāo)準(zhǔn)解讀

《GB 13000.1-1993 信息技術(shù) 通用多八位編碼字符集(UCS) 第一部分:體系結(jié)構(gòu)與基本多文種平面》是中國(guó)國(guó)家標(biāo)準(zhǔn)局發(fā)布的一項(xiàng)關(guān)于字符編碼的標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)旨在為信息技術(shù)領(lǐng)域提供一個(gè)統(tǒng)一的字符編碼系統(tǒng),以支持全球各種語(yǔ)言文字的處理和交換。以下是標(biāo)準(zhǔn)內(nèi)容的具體闡述:

標(biāo)準(zhǔn)背景

隨著信息技術(shù)的發(fā)展和國(guó)際化交流的增加,需要一種能夠覆蓋世界上所有字符的編碼方案,以確保信息在不同系統(tǒng)間準(zhǔn)確無(wú)誤地傳輸。UCS(Universal Multiple-Octet Coded Character Set,通用多八位編碼字符集)應(yīng)運(yùn)而生,它是由ISO和IEC聯(lián)合制定的國(guó)際標(biāo)準(zhǔn)ISO/IEC 10646的中國(guó)版本,旨在實(shí)現(xiàn)這一目標(biāo)。

標(biāo)準(zhǔn)內(nèi)容概述

體系結(jié)構(gòu)

  • 多文種平面(Plane):UCS將所有字符分配到多個(gè)平面上,每個(gè)平面包含2^16(即65536)個(gè)碼位?;径辔姆N平面(Basic Multilingual Plane, BMP)是第一個(gè)平面,包含了最常用的字符,如拉丁字母、希臘字母、西里爾字母、漢字等。
  • 碼位(Code Point):每個(gè)字符在UCS中都有一個(gè)唯一的地址,稱(chēng)為碼位,使用十六進(jìn)制表示。碼位范圍從000000到10FFFF,覆蓋了超過(guò)1百萬(wàn)個(gè)可能的字符位置。
  • 編碼單位:UCS采用變長(zhǎng)編碼方式,最常見(jiàn)的是UTF-8、UTF-16等編碼形式,這些編碼方式根據(jù)字符所在平面的不同,使用不同數(shù)量的字節(jié)來(lái)表示一個(gè)字符。

基本多文種平面

  • 內(nèi)容涵蓋:BMP集中了世界上大多數(shù)語(yǔ)言的文字,包括但不限于漢字、阿拉伯文、希伯來(lái)文、印度文以及多種歐洲語(yǔ)言的字母。
  • 編碼安排:BMP內(nèi)的字符按照Unicode的規(guī)則排列,確保了字符之間的邏輯性和易用性,便于信息處理和檢索。

實(shí)施意義

該標(biāo)準(zhǔn)的實(shí)施為中國(guó)及國(guó)際的信息技術(shù)產(chǎn)品和服務(wù)提供了統(tǒng)一的字符編碼基準(zhǔn),促進(jìn)了跨平臺(tái)、跨語(yǔ)言的信息交流。它不僅支持了中文信息化的深入發(fā)展,還確保了全球范圍內(nèi)不同語(yǔ)言文化的數(shù)字內(nèi)容能夠兼容并蓄,無(wú)縫對(duì)接。

標(biāo)準(zhǔn)應(yīng)用

適用于軟件開(kāi)發(fā)、操作系統(tǒng)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)通信等多個(gè)領(lǐng)域的字符處理,對(duì)促進(jìn)信息技術(shù)的國(guó)際化、標(biāo)準(zhǔn)化進(jìn)程起到了關(guān)鍵作用。


如需獲取更多詳盡信息,請(qǐng)直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 被代替
  • 已被新標(biāo)準(zhǔn)代替,建議下載現(xiàn)行標(biāo)準(zhǔn)GB/T 13000-2010
  • 1993-12-24 頒布
  • 1994-08-01 實(shí)施
?正版授權(quán)
GB 13000.1-1993信息技術(shù)通用多八位編碼字符集(UCS)第一部分:體系結(jié)構(gòu)與基本多文種平面_第1頁(yè)
GB 13000.1-1993信息技術(shù)通用多八位編碼字符集(UCS)第一部分:體系結(jié)構(gòu)與基本多文種平面_第2頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余766頁(yè)可下載查看

下載本文檔

GB 13000.1-1993信息技術(shù)通用多八位編碼字符集(UCS)第一部分:體系結(jié)構(gòu)與基本多文種平面-免費(fèi)下載試讀頁(yè)

文檔簡(jiǎn)介

﹥﹤..

中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)

﹩﹣.—

﹫燉﹫﹦﹤.—

信息技術(shù)通用多八位

編碼字符集(﹤)

第一部分:體系結(jié)構(gòu)與基本多文種平面

﹫┃┄┇│┉┄┃┉┃┄━┄┎—┃┋┇┈━┊━┉┅━┐┉┉

﹤┄﹤┇┉┇┉(﹤)—

┇┉:﹢┇┉┉┊┇┃﹣┈┊━┉━┃┊━━┃

┐┐發(fā)布┐┐實(shí)施

國(guó)家技術(shù)監(jiān)督局發(fā)布

中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)

信息技術(shù)通用多八位編碼字符集(﹤)

第一部分:體系結(jié)構(gòu)與基本多文種平面

﹩﹣.—

﹫┃┄┇│┉┄┃┉┃┄━┄┎—┃┋┇┈━┊━┉┅━┐┉┉﹫燉﹫﹦﹤.—

﹤┄﹤┇┉┇┉(﹤)—

┇┉:﹢┇┉┉┊┇┃﹣┈┊━┉━┃┊━━┃

本標(biāo)準(zhǔn)等同采用國(guó)際標(biāo)準(zhǔn)ISO燉IEC10646.1—1993《信息技術(shù)通用多八位編碼字符集(UCS)

第一部分:體系結(jié)構(gòu)與基本多文種平面》。

主題內(nèi)容與適用范圍

GB13000規(guī)定了通用多八位編碼字符集(UCS)。它可用于世界上各種語(yǔ)言的書(shū)面形式以及附加符

號(hào)的表示、傳輸、交換、處理、存儲(chǔ)、輸入及顯現(xiàn)。

GB13000的這一部分規(guī)定UCS的總體體系結(jié)構(gòu),以及:

.定義在GB13000中使用的術(shù)語(yǔ);

.描述本編碼字符集的總體結(jié)構(gòu);

.規(guī)定UCS的基本多文種平面(BMP),并定義一個(gè)用于世界范圍的各種文字及各種語(yǔ)言書(shū)面

形式的圖形字符集;

.規(guī)定BMP的圖形字符的編碼表示及名稱(chēng);

.規(guī)定UCS的肆八位(32位)正則形式:UCS4;

.規(guī)定UCS的雙八位(16位)BMP形式:UCS2;

.規(guī)定控制功能的編碼表示;

.規(guī)定未來(lái)對(duì)本編碼字符集進(jìn)行補(bǔ)充的管理辦法。

UCS是一種與GB2311所規(guī)定的編碼體系不同的體系。從GB2311中指明UCS的方法規(guī)定于

17.2。

符合性

.總則

在任何情況下,只要按本國(guó)家標(biāo)準(zhǔn)規(guī)定的方法使用專(zhuān)用字符,那么,下列符合性的要求便不再適用

于這些專(zhuān)用字符本身。

.信息交換的符合性

如符合以下條件,便稱(chēng)在用于交換的編碼信息內(nèi)的編碼字符數(shù)據(jù)元素符合本國(guó)家標(biāo)準(zhǔn):

.在該編碼字符數(shù)據(jù)元素內(nèi)的全部圖形字符的編碼表示都符合第6章和第7章,及選自第14章

的一種已標(biāo)識(shí)的形式,并且還符合選自第15章的一種已標(biāo)識(shí)的實(shí)現(xiàn)等級(jí);

.在該編碼字符數(shù)據(jù)元素內(nèi)所表示的全部圖形字符都來(lái)源于一個(gè)已標(biāo)識(shí)的子集(見(jiàn)第13章);

.在該編碼字符數(shù)據(jù)元素內(nèi)的全部控制功能的編碼表示都符合第16章。

符合性聲明必須標(biāo)識(shí)出所采用的形式、所采用的實(shí)現(xiàn)等級(jí)以及所采用的以匯集清單和(或)字符清

國(guó)家技術(shù)監(jiān)督局┐┐批準(zhǔn)

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁(yè),非文檔質(zhì)量問(wèn)題。

評(píng)論

0/150

提交評(píng)論