標準解讀

《GB/T 7027-2002 信息分類和編碼的基本原則與方法》相較于《GB 7027-1986》,在多個方面進行了更新和完善,以適應(yīng)信息技術(shù)快速發(fā)展的需要。首先,在標準的性質(zhì)上,《GB 7027-1986》是強制性國家標準,而《GB/T 7027-2002》則轉(zhuǎn)變?yōu)橥扑]性國家標準(T表示推薦),這反映了國家對于該領(lǐng)域標準化工作態(tài)度的變化,即從強制執(zhí)行轉(zhuǎn)向鼓勵采用。

內(nèi)容上,《GB/T 7027-2002》增加了對信息分類編碼系統(tǒng)設(shè)計過程中的更多指導原則和技術(shù)細節(jié)說明,比如明確了信息分類的基本步驟、分類體系結(jié)構(gòu)的設(shè)計要求等,使標準更加具體化、實用化。此外,新版本還引入了關(guān)于信息編碼規(guī)則的新章節(jié),包括但不限于編碼方式的選擇依據(jù)、編碼長度及格式的規(guī)定等內(nèi)容,旨在提高編碼的一致性和可擴展性。

同時,《GB/T 7027-2002》加強了對國際標準的參考引用,特別是ISO相關(guān)標準,如ISO 11179系列標準中關(guān)于數(shù)據(jù)元素注冊的相關(guān)內(nèi)容被納入考量范圍之內(nèi),增強了我國標準與國際接軌的程度。通過這種方式,不僅有助于促進國內(nèi)外信息交流與共享,也為國內(nèi)信息系統(tǒng)建設(shè)提供了更為科學合理的指導框架。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標準文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2002-07-18 頒布
  • 2002-12-01 實施
?正版授權(quán)
GB-T7027-2002信息分類和編碼的基本原則與方法.pdf_第1頁
GB-T7027-2002信息分類和編碼的基本原則與方法.pdf_第2頁
GB-T7027-2002信息分類和編碼的基本原則與方法.pdf_第3頁
GB-T7027-2002信息分類和編碼的基本原則與方法.pdf_第4頁
GB-T7027-2002信息分類和編碼的基本原則與方法.pdf_第5頁
免費預覽已結(jié)束,剩余15頁可下載查看

下載本文檔

GB-T7027-2002信息分類和編碼的基本原則與方法.pdf-免費下載試讀頁

文檔簡介

I C S 0 11 2 0A 0 0噶日中 華 人 民 共 和 國 國 家 標 準G B / T 7 0 2 7 -2 0 0 2代替 G B / T 7 0 2 7 -1 9 8 6信息分類和編碼的基本原則與方法B a s i c p r i n c i p l e s a n d m e t h o d s f o r i n f o r ma t i o n c l a s s i f y i n g a n d c o d i n g2 0 0 2 一 0 7 門8 發(fā)布2 0 0 2 一 1 2 一 0 1實施中華人民共和國國 家 質(zhì) 量 監(jiān) 督 檢 驗 檢 疫 總 局發(fā)布GB/ T 7 0 2 7 -2 0 0 2目次前言 。 1引言 。 N1 范 圍 . 12 規(guī)范性引用文件 . 13 術(shù)語和定義 。 14 信息的分類與編碼 14 . 1 信息分類 。 14 . 2 信息編碼 15 信息分類的基本原則 。 。 25 . 1科學性 , 。 25 . 2系統(tǒng)性 25 . 3 可擴延性 , , 。 25 . 4 兼容性 。 25 . 5 綜合實用性 。 26 信息分類的基本方法 。 26 . 1概述 26 . 2 線分類法 , , 、 、 、 、 、 、 一263面分類法 36 . 4 混合分類法 。 . 37 信息編碼的基本原則 。 。 37 . 1唯一性 。 37 . 2 合理性 。 。 37 . 3 可擴充性 37 . 4簡明性 37 . 5適用性 37 . 6 規(guī) 范性 。 38 信息編碼的基本方法 48 . 1 通 則 48 . 2 代碼類型 。 48 . 3 代碼 特征 78 . 4 代碼表現(xiàn)形式 88 . 5 代碼設(shè)計 1 08 . 6 代碼賦值約定 n附錄A( 資料性附錄) 各種信息分類編碼方法的優(yōu)缺點 1 2A . 1 信息分類方法優(yōu)缺點 . 1 2A . 2各 種 類 型 代 碼編 碼 方 法 優(yōu) 缺 點 . . . . . . . . . . . . . . . . . . 1 2GB / r 7 0 2 7 - 2 0 0 2前言 本標準是對GB / T 7 0 2 7 -1 9 8 6 標準化工作導則信息分類編碼的基本原則和方法 的修訂。 在信息編碼部分內(nèi)容上, 本標準參考了國際技術(shù)報告I S O/ I E C TR 9 7 8 9 : 1 9 9 4 ( E) 信息技術(shù)數(shù)據(jù)交換用數(shù)據(jù)元素組織與表示指南編碼方法與原理 , 采納了其中比較成熟的相關(guān)技術(shù)內(nèi)容。 本標準代替 G B / T 7 0 2 7 -1 9 8 6 標準化工作 導則信 息分類 編碼 的基本原則和方法 同GB / T 7 0 2 7 -1 9 8 6 相比, 本次修訂所作的主要修改是:修改了標準的名稱。標準名稱改為 信息分類和編碼的基本原則與方法 。標準的總體編排和結(jié)構(gòu)按G B / T 1 . 1 -2 0 0 。進行了修改, 增加了目次、 前言、 引言和附錄Ao 一 對原標準的內(nèi)容進行 r相應(yīng)的增刪 增補的內(nèi)容包括: 第 2 章“ 規(guī)范性引用文件” 、 第 3 章“ 術(shù)語和定義” 和第4章“ 信息的分類與編碼” 概述刪除的內(nèi)容是 原標準的第 2 . 4 條“ 代碼的校驗” 的有關(guān)算法 。 一一對原標準的結(jié)構(gòu)進行了調(diào)整: 原標準的第 1 . 1 條“ 信息分類的基本原則” 調(diào)整為第 5 章, 原標準的第 1 . 2 條“ 信息分類的基本方法” 調(diào)整為第 6 章, 原標準的第 2 . 2 條“ 編碼的基本原則” 調(diào)整為第 7 章,原標準的第 2 . 3 條“ 代碼的種類” 和第 2 . 5條“ 代碼的類型” 與 I S O/ I E C T R 9 7 8 9 的相關(guān)技術(shù)內(nèi)容經(jīng)過整理共同構(gòu)成第 8 章“ 信息編碼的基本方法” , 原標準中分散敘述的各個信息分類和編碼力法的優(yōu)缺點集中匯總調(diào)整為“ 附錄 A各種信息分類編碼方法的優(yōu)缺點” 。 一對原標準中的代碼名稱進行了若干項調(diào)整: 原標準中的“ 特征組合碼” 對應(yīng)于本標準的“ 并置碼” , 原標準中的“ 復合碼” 對應(yīng)于木標準的“ 組合碼” , 原標準中的“ 數(shù)值化字母順序碼” 被本標準的“ 約定順序碼” 所涵蓋 在信息分類編碼標準化領(lǐng)域, 本標準應(yīng)與G B / 丁2 0 0 0 1 . 3 -2 0 0 1 標準編寫規(guī)則第3 部分: 信息分類編碼 和GB / T 1 0 1 1 3 分類編碼通用術(shù)語 兩項標準配套應(yīng)用。 本標準的附錄A是資料性附錄。 本標準由中國標準研究中心提出并歸口 本標準主要起草單位: 中國標準研究中心。 本標準主要起草人 李小林、 馮衛(wèi)、 胡嘉璋。 G B / T 7 0 2 7 于1 9 8 6年1 1月首次發(fā)布, 本次修訂為第一次修訂。Gs/ T 7 0 2 7 - 2 0 0 2引言 在通常情況下, 人們對信息的理解是: 一切有含義的具體或抽象事物或概念的真相及相關(guān)陳述, 通過數(shù)據(jù)、 消息及其進一步細節(jié)表達出來。 在信息分類編碼領(lǐng)域, 信息的表現(xiàn)形式是數(shù)據(jù)。 客觀、 明確的信息是計算機建立信息系統(tǒng)以及數(shù)據(jù)在其中進行交換的先決條件。 在信息系統(tǒng)中, 數(shù)據(jù)是用字符( 通常為數(shù)字或字母) 、 算術(shù)符號以及描述來表示, 這些表示形式應(yīng)該對其所涉及的每一個數(shù)據(jù)都有一個明確穩(wěn)定的含義, 從而達到處理與交流的目的。 信息要被不同用戶組或應(yīng)用系統(tǒng)所共享 , 就必須有一致認可的定義, 舉例來說, 要有概念的語義含義( 內(nèi)涵) 、 概念的全部實例( 外延) 以及一致認可的表示法。 對各類信息概念的正確理解需要依賴于信息分類; 對各類信息作出一致認可的表示需要依賴于信息編碼 。GB / r 7 0 2 7 -2 0 0 2信息分類和編碼的基本原則與方法范 圍本標準規(guī)定了信息分類編碼的基本原則和方法, 適用于各類信息分類編碼標準的編制2規(guī)范性 引用 文件 下列文件中的條款通過本標準的引用而成為本標準的條款。 凡是注日 期的引用文件, 其隨后所有的修改單( 不包括勘誤的內(nèi)容) 或修訂版均不適用于本標準, 然而, 鼓勵根據(jù)本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注 日期的引用文件, 其最新版本適用于本標準。 G B / T 1 9 8 8 -1 9 9 8 信息技術(shù)信息交換用七位編碼字符集( e q v I S O/ I E C 6 4 6 : 1 9 9 1 ) G B 2 3 1 2 -1 9 8 。 信息交換用漢字編碼字符集基本集 G B / T 2 2 6 0 -2 0 0 2 中華人民共和國行政區(qū)劃代碼 G B / T 2 6 5 9 -2 0 0 0 世界各國和地區(qū)名稱代碼( e q v I S O 3 1 6 6 - 1 : 1 9 9 7 ) G B / T 4 6 5 7 -2 0 0 2 中 央黨政機關(guān)、 人民團 體及其他機構(gòu)代碼 G B / T 7 4 0 8 -1 9 9 4 數(shù)據(jù)元和交換格式信息交換日 期和時間表示法( e q v I S O 8 6 0 1 : 1 9 8 8 ) G B / T 1 0 1 1 3 分類編碼通用術(shù)語 G B 1 1 6 4 3 -1 9 9 9 公民身份號碼 G B / T 1 3 7 4 5 -1 9 9 2 學科分類與代碼 GB / T 1 4 7 2 1 . 1 -1 9 9 3 林業(yè)資源分類與代碼森林類型 G B / T 1 4 8 0 5 -1 9 9 3 用于行政、 商業(yè)和運輸業(yè) 電子數(shù)據(jù)交換的應(yīng)用級語法規(guī)則( i d t I S O 9 7 3 5 :1 9 8 8 ) G B / T 1 7 7 1 0 -1 9 9 9 數(shù)據(jù)處理校驗碼系統(tǒng)( id t I S O 7 0 6 4 : 1 9 8 3 )3術(shù)語和定義G B / T 1 0 1 1 3中確立的術(shù)語適用于本標準。4 信息的分類與編碼4 門信息分類 信息分類是根據(jù)信息內(nèi)容的屬性或特征, 將信息按一定的原則和方法進行區(qū)分和歸類, 并建立起一定的分類體系和排列順序。 信息分類有兩個要素: 一是分類對象, 二是分類的依據(jù)。分類對象由若干個被分類的實體組成。分類依據(jù)取決于分類對象的屬性或特征。 信息內(nèi)容屬性的相同或相異, 形成了各種不同的類。在信息分類體系中, 類可稱為類目。4 . 2 信 息編碼 信息編碼是將事物或概念( 編碼對象) 賦予具有一定規(guī)律、 易于計算機和人識別處理的符號, 形成代碼元素集合。代碼元素集合中的代碼元素就是賦予編碼對象的符號, 即編碼對象的代碼值。 所有類型的信息都能夠進行編碼 : 如關(guān)于產(chǎn)品、 人、 國家、 貨幣、 程序、 文件、 部件等各種各樣的信息。 信息編碼包含的內(nèi)容有: 數(shù)據(jù)表達成代碼的方法、 數(shù)據(jù)的代碼表示形式、 代碼元素集合的賦值。 信息編碼的主要作用有: 標識、 分類、 參照。G B / r 7 0 2 7 -2 0 0 2 標識的目的是要把編碼對象彼此區(qū)分開, 在編碼對象的集合范圍內(nèi), 編碼對象的代碼值是其唯一性標志; 信息編碼的分類作用實質(zhì)上是對類進行標識; 信息編碼的參照作用體現(xiàn)在編碼對象的代碼值可作為不同應(yīng)用系統(tǒng)或應(yīng)用領(lǐng)域之間發(fā)生關(guān)聯(lián)的關(guān)鍵字。5 信 息分 類的基本原則5 門科學性 宜選擇事物或概念( 即分類對象) 最穩(wěn)定的本質(zhì)屬性或特征作為分類的基礎(chǔ)和依據(jù)。5 , 2系統(tǒng)性 將選定的事物、 概念的屬性或特征按一定排列順序予以系統(tǒng)化, 并形成一個科學合理的分類體系。5 . 3可擴延性 通常要設(shè)置收容類 目, 以保證增加新的事物或概念時, 不打亂已建立的分類體系, 同時, 還應(yīng)為下級信息管理系統(tǒng)在本分類體系的基礎(chǔ)上進行延拓細化創(chuàng)造條件。5 . q 兼容性 應(yīng)與相關(guān)標準( 包括國際標準) 協(xié)調(diào)一致。5 . 5 綜合實用性 分類要從系統(tǒng)工程角度出發(fā), 把局部問題放在系統(tǒng)整體中處理, 達到系統(tǒng)最優(yōu)。即在滿足系統(tǒng)總?cè)蝿?wù)、 總要求的前提下, 盡量滿足系統(tǒng)內(nèi)各相關(guān)單位的實際需要6信息分類的基本方 法6 . 1概述 信息分類的基本方法有三種: 線分類法、 面分類法、 混合分類法。其中線分類法又稱層級分類法、 體系分類法; 面分類法又稱組配分類法。6 . 2線分類法6 . 2 . 1方法 線分類法是將分類對象( 即被劃分的事物或概念) 按所選定的若干個屬性或特征逐次地分成相應(yīng)的若干個層級的類目, 并排成一個有層次的, 逐漸展開的分類體系。 在這個分類體系中, 被劃分的類目稱為上位類, 劃分出的類目稱為下位類, 由一個類目直接劃分出來的下一級各類目, 彼此稱為同位類 同位類類目之間存在著并列關(guān)系, 下位類與上位類類目之間存在著隸屬關(guān)系。6 - 2 - 2示例 GB / T 1 4 7 2 1 . 1 -1 9 9 3 林業(yè)資源分類與代碼森林類型 是采用線分類法, 并用五位數(shù)字代碼進行表示的。 該標準將森林類型分成三個層級, 第一層級用第一、 二位數(shù)字碼表示森林植被型, 第二層級用第三位數(shù)字表示森林類型組, 第三層級用第四、 五位數(shù)字表示森林類型。部分代碼表見表 t o 表 1代碼類 型 名 稱3 0 0 0 03 1 6 0 03 1 6 1 13 1 6 1 23 1 6 1 33 1 8 0 03 1 8 1 13 1 8 1 23 1 8 1 3經(jīng) 濟 林 飲 料 林 茶 葉 林 咖 啡 林 可 可林 鮮 果 林 蘋 果 林 梨 樹 林 桃 樹 林在表 1中, 經(jīng)濟林相對于飲料林、 鮮果林為上位類類目, 飲料林、 鮮果林相對于經(jīng)濟林為下位類類Gs / T 7 0 2 7 -2 0 0 2目, 飲料林、 鮮果林是同位類類目; 同理, 飲料林相對于茶葉林、 咖啡林、 可可林是上位類類 目, 茶葉林、 咖啡林 、 可可林是飲料林 的下位類 類 目, 茶 葉林 、 咖啡林 、 可可林是同位類類 目。6 . 2 . 3 要求 a )由某一 上位類劃分出的下位類類 目的總范 圍應(yīng) 與該上位類類 目范圍相等 ; b) 當某一個上位類類 目劃分成若 干個下位類類 目時 , 應(yīng)選擇同一種劃分基準 ; c ) 同位類類 目之間不交叉、 不重復 , 并只對應(yīng)于一個上 位類 ; d) 分類要依次進行 , 不應(yīng)有空層或加層 。6 . 3 面分類法6 . 3 門方法 面分類法是將 所選定 的分類對象 的若干屬性或特 征視為若干個“ 面” , 每個“ 面” 中又可分成彼此 獨立 的若 干個 類 目。使用時 , 可根據(jù)需要將這些“ 面” 中的類 目組合 在一起 , 形成一個復合類 目。6 . 3 . 2示例 服裝的分類可采用面分類法, 選服裝所用材料、 男女式樣、 服裝款式作為三個“ 面” , 每個“ 面” 又可分成若 干個類 目, 見表 2 表 2 材料男 女 式 樣一月 ; 裝 款 式一純 棉純 毛中 長 纖 維男 式女 式中 山 裝西 服獵 裝連 衣 裙 使用時, 將有關(guān)類目組配起來。如純毛男式中山裝, 中長纖維女式西服等。6 . 13 要求 a ) 根據(jù)需要選擇分類對象本質(zhì)的屬性或特征作為分類對象的各個“ 面” ; b ) 不同“ 面” 內(nèi)的類目不應(yīng)相互交叉, 也不能重復出現(xiàn); c ) 每個“ 面” 有嚴格的固定位置; d ) “ 面” 的選擇以及位置的確定, 根據(jù)實際需要而定6 . 4混合分 類法 混合分類法是將線分類法和面分類法組合使用, 以其中一種分類法為主, 另一種做補充的信息分類方 法了信息編碼 的基本 原則了 . 1 唯一性 在一個分類編碼標準中, 每一個編碼對象僅應(yīng)有一個代碼, 一個代碼只唯一表示一個編碼對象了 . 2 合理性 代碼結(jié)構(gòu)應(yīng)與分類體系相適應(yīng)。了 . 3可擴充性 代碼應(yīng)留有適當?shù)暮髠淙萘浚?以便適應(yīng)不斷擴充的需要。7 . 4簡明性 代碼結(jié)構(gòu)應(yīng)盡量簡單, 長度盡量短, 以便節(jié)省機器存儲空間和減少代碼的差錯率7 . 5適用性 代碼應(yīng)盡可能反映編碼對象的特點, 適用于不同的相關(guān)應(yīng)用領(lǐng)域, 支持系統(tǒng)集成了 . 6規(guī)范性GB / r 7 0 2 7 - 2 0 0 2在一個信息分類編碼 標準中 , 代碼 的類 型 , 代碼 的結(jié) 構(gòu)以及 代碼的編寫格式應(yīng)當統(tǒng)一。8 信 息編碼的基本方法8 門通則 編碼方法應(yīng)以預定的應(yīng)用需求和編碼對象的性質(zhì)為基礎(chǔ), 選擇適當?shù)拇a結(jié)構(gòu)。 在決定代碼結(jié)構(gòu)的過程中, 既要考慮各種代碼的編碼規(guī)則, 又要考慮各種代碼的優(yōu)缺點( 參見附錄A) , 還要分析代碼的一般性特征, 選取合適的代碼表現(xiàn)形式, 研究代碼設(shè)計所涉及的各種因素, 避免潛在的不良后果。代 碼類型圖 1 根據(jù)代碼的含義性( 參見 8 . 3 . 2條) 給出了各種常用代碼的類型。圖 1順 序碼 規(guī)則門乙n/藝 OUCOQU 從一個有序的字符集合中順序地取出字符分配給各個編碼對象。這些字符通常是 自然數(shù)的整數(shù),如 以“ 1 ” 打頭; 也可以是字母字符, 如: AA A, A AB , AA C. . . . . . . o8 . 2 . 1 . 2 應(yīng) 用 順序碼一般作為以標識或參照為目的的獨立代碼來使用, 或者作為復合代碼的一部分來使用, 后一種情況經(jīng)常附加著分類代碼。 在碼位固定的數(shù)字字段中, 應(yīng)使用零填滿字段的位數(shù)直到滿足碼位的要求 示例: 在 3 位數(shù)字字段中, 數(shù)字 1 編碼為 。 0 1 , 而數(shù)字 1 5 編碼為 。 1 5 08 . 2 . 1 . 3 類型 順序碼有三種類型: 遞增順序碼、 分組順序碼、 約定順序碼。8 . 2 . 1 . 3 門遞增順序碼 編碼對象被賦予的代碼值, 可由預定數(shù)字遞增決定。 例如, 預定數(shù)字可以是 1 ( 純遞增型) , 或者是 1 0( 只有 1 0的倍數(shù)可以賦值) , 或者是其他數(shù)字( 如: 偶數(shù)情況下的 2 ) , 等等。 用這種方法, 代碼值不帶有任何含義。相類似的編碼對象的代碼值不作分組。 為了以后原始代碼集的修改, 可能需要使用中間的代碼值, 這些中間代碼值的賦值根據(jù)不必按 1遞增 。 示例 GB / T 2 6 5 9 -2 0 0 0 ( 世界各國和地區(qū)名稱代碼 中, 部分國家和地區(qū)的數(shù)字代碼( 見表 3 ) ,GB / r 7 0 2 7 -2 0 0 2表 3招*#AAL RlSAMOA 一 一 一下 該標準中, 后來增加的地區(qū)名稱南極洲( A N T AR C TI C A) 使用了中間代碼值。 1 0 , 屬于對原始代碼集的增補。8 . 2 . 1 . 3 . 2 系列順序碼 這種代碼首先要確定編碼對象的類別, 按各個類別確定它們的代碼取值范圍, 然后在各類別代碼取值范圍內(nèi)對編碼對象順序地賦予代碼值。 示例: G B / T 4 6 5 7 -2 0 0 2 中央黨政機關(guān)、 人民團體及其他機構(gòu)代碼 , 就采用了三位數(shù)字的系列順序碼 。 1 0 0 1 9 9 表示全國人大、 全國政協(xié)、 高檢、 高法機構(gòu) 2 0 0 - 2 9 9 表示中央直屬機關(guān)及直屬事業(yè)單位 3 0 0 - 3 9 9夫示圍各陣各部季 7 0 0 7 9 9表7全國性人 民團體 、 民主黨派機關(guān) 系列順序碼只有在類別穩(wěn)定并且每一具體編碼對象在目前或可預見的將來不可能屬于不同類別的條件下才能使用。8 . 2 . 1 . 3 . 3約定順序碼 約定順序碼不是一種純順序碼。這種代碼只能在全部編碼對象都預先知道并且編碼對象集合將不會擴展的條件下才能順利使用。 在賦予代碼值之前, 編碼對象應(yīng)按某些特性進行排列, 例如: 依名稱的字母順序排序, 按( 事件、 活動的) 年代順序排序等。這樣得到的順序再用代碼值表達, 而這些代碼值本身也應(yīng)是從有序的列表中順序選 出的 示例: 按英文字母順序排列的數(shù)值化字母順序碼( 見表 4 ) 0 表 4代碼名稱0 10 20 30 4A p p l e s ( 蘋果)B a n a n a s ( 香蕉)C h e r r i e s ( 櫻桃)D a t e s棗)8 - 2 . 2無序碼8 . 2 . 2 . 1 規(guī)則 無序碼是將無序的自然數(shù)或字母賦予編碼對象。 此種代碼無任何編寫規(guī)律, 是靠機器的隨機程序編寫的8 . 2 . 2 . 2 應(yīng)用 無序碼既可用作編碼對象的自身標識, 又可作為復合代碼的組成部分( 復合代碼的其他部分則以其他編碼規(guī)則為基礎(chǔ)) 。GB/ r 7 0 2 7 -2 0 0 28 . 2 . 3縮寫碼8 . 2 - 3 . 1規(guī)則 這種代碼的本質(zhì)特性是依據(jù)統(tǒng)一的方法縮寫編碼對象的名稱, 由取自編碼對象名稱中的一個或多個字符賦值成編碼表示8 . 2 . 3 . 2應(yīng)用 縮寫碼能有效用于那些相當穩(wěn)定的、 并且編碼對象的名稱在用戶環(huán)境中已是人所共知的有限標識代碼集。 示例: GB / T 2 6 5 9 -2 0 0 0 ( 世界各國和地區(qū)名稱代碼 中, 部分國家的字母代碼見表 5 e 表 5國 家 名 稱代碼奧 地 利AUS T R工 A加拿大C AN AD A中國C HI N A法國F R AN C E美 國UN I T E D S T A TE SATCACNFRU S8 . 2 . 4層次碼8 . 2 . 4 . 1規(guī)則 層次碼以編碼對象集合中的層級分類為基礎(chǔ), 將編碼對象編碼成為連續(xù)且遞增的組( 類) 。 位于較高層級上的每一個組( 類) 都包含并且只能包含它下面較低層級全部的組( 類) 。這種代碼類型以每個層級上編碼對象特性之間的差異為編碼基礎(chǔ)。每個層級上特性必須互不相容。 細分至較低層級的層次碼實際上是較高層級代碼段和較低層級代碼段的復合代碼。 層次碼的一般結(jié)構(gòu)如圖 2 所示: x x x x x x第三層代碼第二層代碼第一層代碼圖 28 . 2 . 4 . 2應(yīng)用 層次碼通常用于分類的目的。層級數(shù)目的建立依賴于信息管理的需求。層次碼較少用于標識和參照的 目的 。 層次碼非常適合于諸如統(tǒng)計目的、 報告貨物運轉(zhuǎn)、 基于學科的出版分類等情況。在實踐中既有固定格式 , 也有 可變格式。固定格式 比可變格式 更容易處理一些 。 示例 1 : 固定遞增格式。 G B / T 1 3 7 4 5 -1 9 9 2 學科分類與代碼 中學科代碼格式由7個數(shù)字位組成,下一級學科相對于上一級學科按固定的 2 位代碼段遞增, 其部分代碼見表 6 0 表 6 代碼學科 名稱1 1 01 1 0 . 1 41 1 0 1 們 0數(shù) 學 數(shù)理邏輯與數(shù)學基礎(chǔ) 演 繹 邏 輯 學 示例2 : 可變遞增格式。 在通用十進制分類法( UD C ) 中, 字符的數(shù)目和編碼表達式的分段是可變的,其細節(jié)描述的程度能被延伸到想要達到的層級?!?建筑學的屋頂坡度” 這樣一個概念可被編碼表達式表達成 6 2 4 . 0 2 4 . 1 3 0GB / r 7 0 2 7 - - 2 0 0 2 6 2 4土木工程 6 2 4 . 0 2建筑物成分 6 2 4 - 0 2 4屋頂, 屋頂用材料 6 2 4 . 0 2 4 . 1 3屋頂坡度8 . 2 5 矩 陣碼8 . 2 . 5 . 1規(guī)則 矩陣碼以復式記錄表的實體為基礎(chǔ)。賦予這個表中行和列的值用于構(gòu)成表內(nèi)相關(guān)坐標上編碼對象的代碼表示。 這種方法的目的是對矩陣表中的編碼對象賦予有含義的代碼值, 這些編碼對象在不同的組合中具有若于共同特性。8 . 2 . 5 . 2 應(yīng)用 矩陣碼可有效地用于標識那些具有良好結(jié)構(gòu)和穩(wěn)定特性的編碼對象 示例: G B 2 3 1 2 -1 9 8 0 信息交換用漢字編碼字符集基本集 根據(jù)矩陣碼編碼方法對漢字信息交換) IJ 的基本圖形字符編制了區(qū)位碼, 其中區(qū)號為矩陣表中的行號, 位號為矩陣表中的列號。漢字字符 啊” 用區(qū)位碼 1 6 -0 1 編碼表示, 在這里, 1 6 為區(qū)號, 0 1 為位號; 同理, 拉丁字符 A” 用區(qū)位碼 0 3 -1 3 編碼表示, 圖形字符“ ” 用區(qū)位碼 0 1 -1 3 編碼表示。8 . 2 . 6 并置碼8 . 2 . 6 門規(guī)則 并置碼是由一些代碼段組成的復合代碼, 這些代碼段提供了描繪編碼對象的特性。 這些特性是相互獨立的。這種方法的編碼表達式可以是任意類型( 順序碼、 縮寫碼、 無序碼) 的組合。8 . 2 . 6 . 2應(yīng)用 并置碼非常適用于那些具有若干共同特性的商品分類 應(yīng)用代碼段是要作出描繪性編碼( 何種產(chǎn)品、 何時何地生產(chǎn)) 或者是用作開發(fā)制造業(yè)方面的成組技術(shù)方法 示例: 軌道編碼。 x x x x x x x x 等級形狀尺寸 等級、 形狀和尺寸這三個特性在很大程度上是相互獨立的8 . 2 . 7 組 合碼8 . 2 . 7 門規(guī)則 組合碼也是由一些代碼段組成的復合代碼, 這些代碼段提供了編碼對象的不同特性 與并置碼不同的是, 這些特性相互依賴并且通常具有層次關(guān)聯(lián)。8 . 2 - 7 . 2應(yīng)用 組合碼經(jīng)常被用于標識 目的, 以覆蓋寬泛的應(yīng)用領(lǐng)域 示例: G B 1 1 6 4 3 - 1 9 9 9 公民身份號碼公民身份號碼含義x x x x x xx x x x x x 又 x x x x xx x x x x x X x x x x x x x X x x x公民身份號碼的t 8 位組合碼結(jié)構(gòu)行政區(qū)劃代碼出 生 日期順序號, 其中奇數(shù)表示男性, 偶數(shù)表示女性校 驗 碼 整個 1 8位組合碼共分 4段, 前兩個代碼段標識了編碼對象( 公民) 的空間和時間特性, 第三個代碼段則依賴于前兩個代碼段所限定的范圍, 第四個代碼段依賴于前三個代碼段賦值后的校驗計算結(jié)果8 . 3代碼特征G B / r 7 0 2 7 -2 0 0 28 . 3 . 1 概述 代碼的一般性特征除第 7 章“ 信息編碼的基本原則” 所論述的唯一性、 合理性、 可擴充性、 簡明性、 適用性以外 , 還包括: 穩(wěn)定性、 含義性、 代碼長度、 結(jié)構(gòu)與格式、 容量等特征8 . 3 - 2 穩(wěn)定性 當代碼為設(shè)計的變化留有余地而不必修改其結(jié)構(gòu)時, 代碼就是穩(wěn)定的 用戶需要穩(wěn)定的代碼代碼值的賦值必須考慮相對于代碼值 自身以及代碼結(jié)構(gòu)作偶然修改的最小可能性。 當某個代碼元素從代碼元素集合中撤銷時, 原編碼表示不應(yīng)再為其他編碼對象所用8 . 3 . 3 含義性 如果代碼的編碼表達式直接( 例如; 縮寫碼) 表達或間接根據(jù)一個或多個表( 例如 層次碼、 矩陣碼、并置碼) 來表達它們的含意, 則代碼就被認為是有含義的。 在使用編碼表達式時, 有含義也與根據(jù)編碼對象特性進行的歸類和分組 類) 有關(guān)。 在以分類為目的情況下, 有含義是尤其重要的。對于以標識和參照為目的者, 宜用無含義代碼8 . 3 . 4 代碼長度 代碼長度是指編碼表達式位置的數(shù)目。代碼長度可被規(guī)定成固定的或可變的字符數(shù)目。 注: 可變的代碼長度有兩條主要缺欠: 其一是當存儲代碼值的數(shù)據(jù)字段所容納的字符數(shù)比使用的代碼值字符數(shù)多 時, 字符數(shù) 目的不可預知會產(chǎn)生排列對齊問題。 其二是由于字符冗余或增加引起的錯誤不能被人工或機器容易 地檢測出來。因此, 代碼長度宜使用固定的字符數(shù)目。8 . 3 . 5 結(jié)構(gòu)與格式 代碼結(jié)構(gòu)定義包括: 構(gòu)成編碼表達式的位置或位置組的數(shù)目, 以及每一位置上有效字符的集合。其中空格可以作為結(jié)構(gòu)的組成部分。 檢查語法錯誤的輸人確認主要與結(jié)構(gòu)相關(guān) 就各個位置組來說, 編碼表達式的每個位置都可以這樣定義其格式 字母的、 數(shù)字的、 字母數(shù)字的、 特殊字符的。8 . 3 . 6 容f 容量是指編碼表達式的數(shù)量, 它是在選定的基數(shù)范圍內(nèi), 由每個位置上全部可用的字符組合構(gòu)成的 。 示例 ( C表示容量) a ) 對于位置數(shù) 目是 1 , 基數(shù)是2 , 使用二進制字符:C=2 b ) 對于位置數(shù)目是 3 , 基數(shù)是 1 0 , 使用十進制數(shù)字字符:C =1 0 0 0 c ) 對于位置數(shù)目是 2 , 基數(shù)是 2 6 , 使用字母字符:C-6 7 6 理論容量以全部字符的所有組合都得到使用為前提。 由于實踐或理論原因造成的初始限制, 減少了這些理論容量。實際上, 容量的抉擇是在以下各因素之間折衷的結(jié)果: a ) 對擴充系統(tǒng)的預見; b ) 組成代碼表達式的字符數(shù)目的限制; c ) 書寫和使用代碼表達式的容易程度; d ) 系統(tǒng)的期望使用壽命; e ) 操作代價, 等等8 . 4代碼表現(xiàn)形式8 . 4 . 1 數(shù)字格式代碼 數(shù)字格式代碼是用一個或若干個阿拉伯數(shù)字表示編碼對象的代碼, 簡稱為數(shù)字碼。 數(shù)字碼的特點是結(jié)構(gòu)簡單, 使用方便 , 排序容易并且易于國內(nèi)、 外推廣 但是對編碼對象特征描述不直觀。 在數(shù)字格式代碼值賦 值時, 不宜使用 全部是。 或全部是9 的值, 如 0 0 0 0 ” 和“ 9 9 9 9 。 這些值應(yīng)當 保留用于特殊情形。GB/ T 7 0 2 7 -2 0 0 28 . 4 . 2 字母格式代碼 字母格式代碼是用一個或多個拉丁字母表示編碼對象的代碼 , 簡稱為字母碼。 字母碼的特點。其一是容量大, 如用二位拉丁字母代碼最多可表示 6 7 6 ( 2 6 ) 個類目, 而二位數(shù)字代碼最多只可表示1 0 0 ( 1 0) 個類目。 其二是字母碼有時可提供便于人們識別的信息。 如在GB / T 2 2 6 。中,B J 表示北京; TJ 表示天津 字母碼便于人們記憶, 但不便于機器處理信息, 特別是當編碼對象數(shù)目較多或添加、 更改頻繁以及編碼對象名稱較長時, 常常會出現(xiàn)重復和沖突的現(xiàn)象。因此, 字母碼常用于編碼對象較少的情況。 為字母格式代碼賦值時. 應(yīng)注意: a ) 無含義字母碼應(yīng)當避免采用那些在發(fā)音時可能引起混淆的字符( 聽覺上的相似性) ; 例如: 字母 B , D, G, P和 T, 或者字母 M和N, b ) 在字母代碼中, 或者在代碼的一部分有 3個或更多的連續(xù)字母字符時, 要避免使用元音字母 ( A, E , I , O和U) , 以免無意間形成易被誤認的簡單語言單詞。 c ) 在同一編碼方案中, 字母代碼宜使用單一形式的大寫或小寫字母 , 而不宜大小寫字母混用。8 . 4 . 3混合格式代碼 混合格式代碼是由數(shù)字、 字母組成的代碼, 或由數(shù)字、 字母、 特殊字符組成的代碼??梢院喎Q為字母數(shù)字碼或數(shù)字字母碼。 混合格式代碼的特點是基本兼有了數(shù)字型代碼、 字母型代碼的優(yōu)點, 結(jié)構(gòu)嚴密, 具有良好的直觀性,同時又有使用上的習慣。 但是, 由于代碼組成格式復雜也帶來了一定的缺點, 即計算機輸人不方便, 錄人效率低, 錯誤率增高, 不便于機器處理。8 . 4 . 4 特殊字符 特殊字符( 如: & . , G, . . . . ) 可以用于數(shù)字與字母混合格式代碼中以補充字母系統(tǒng)的字符; 用這種方法, 容量得到增加, 并且可以為特殊處理保留語種字符的有效字符。 在代碼結(jié)構(gòu)中應(yīng)使用常用的字符, 并且應(yīng)避免那些非字母或數(shù)字的字符( 例如: 連字符、 句號、 間隔、星號, 等等) , 只是在分隔代碼段時, 才可以使用連字符或空格。用于規(guī)定代碼系統(tǒng)的詞表應(yīng)當只含有盡可能少的字符種類 下列字符應(yīng)避免使用: a ) 不屬于G B / T 1 9 8 8七位編碼字符集的字符。 b ) 可能引起曲解或不正確轉(zhuǎn)錄的字符。例如: 應(yīng)注意排除空格, 1 2 3 A B C, 應(yīng)寫成“ 1 2 3 A B C , 因 為空格沒有含義, 并民空格在轉(zhuǎn)錄時可能被忽略。 c ) 對于數(shù)據(jù)交換來說, 在語法結(jié)構(gòu)中可被當作服務(wù)性字符使用的那些字符。例如: 冒號( : ) 、 加號 ( +) 、 問號( ? ) 、 星號( ,) 、 撇號(C) 在 G B / T 1 4 8 0 5 標準中是被當作服務(wù)字符使用的, 應(yīng)避免使 用這類字符。8 . 45 代碼格式規(guī)則 代碼值的格式( 或字符結(jié)構(gòu)) 最好采用全數(shù)字或全字母格式。只有在特殊位置上( 例如: 首位或末位) 始終要用字母或數(shù)字格式時, 才能使用字母數(shù)字混合格式, 而隨機的字母數(shù)字格式則不宜使用。 在不存在助記特性的情況下, 人工記錄數(shù)字格式的代碼值通常比記錄字母格式或混合格式的代碼值要更加可靠些。受控的混合格式代碼值( 例如: 在確定的位置上永遠采用字母格式或者永遠采用數(shù)字格式) 比隨機的混合格式代碼值更加可靠些。例如: A A9 9 9 ( 前兩位字符永遠采用字母格式, 后三位字符永遠采用數(shù)字格式) 就比字母或數(shù)字有可能出現(xiàn)在任意位置上的情形具有更加可靠的格式。 在混合格式中, 同類的字符類型應(yīng)當作分組處理并且不要分散于代碼表達式的各個位置上。例如:在三位字符代碼中, “ 字母一字母一數(shù)字” 的結(jié)構(gòu)( 如: H W5 ) 就比“ 字母一數(shù)字一字母” 這樣的順序( 如:H 5 W) 所發(fā)生錯誤的要少很多 當需要使用字母數(shù)字混合代碼結(jié)構(gòu)時, 應(yīng)當避免那些容易理解成其他字符或者容易同其他字符相G B / r 7 0 2 7 - - 2 0 0 2混淆的字符。例如: 字母 工 與數(shù)字1 、 字母 0與數(shù)字 。 、 字母 Z與數(shù)字 2 、 字母G與數(shù)字6 、 字母B和S與數(shù)字 8 , 以及字母 0與 Q。 為了避免對照排序時互不相容, 任何特定字符的位置上應(yīng)當要么只用字母, 要么只用數(shù)字。8 . 4 . 6 編碼表達式的顯示 對于手工處理, 宜優(yōu)先采用人工易讀的編碼顯示方式。在這種情況下, 代碼值將以拉丁字母和阿拉伯數(shù)字方式出現(xiàn)。這種表達方式也常用于計算機輸出的紙質(zhì)文件和表冊當中 當需要采用機械或電子方式進行處理時, 應(yīng)采用易于自動識別的編碼顯示方式。其中, 以若干個條排列編碼成符號表示的條碼編碼方法得到了) 泛使用此外, 其他 自動化標識方法, 如光學字符識讀( O C R) 設(shè)備或磁條、 集成電路的智能卡等在實踐中也已得到了使用8 . 5代碼設(shè)計8 . 5 . 1 概述 代碼設(shè)計過程中, 應(yīng)注意那些常??赡茉斐杀舜讼嗷_突的要求。例如: 如果一種代碼結(jié)構(gòu)對于未來的需要有充足的擴充能力, 那么它就會在某種程度上犧牲其簡明性。因此, 每個方面的問題都必須考慮周全, 制定折衷辦法, 以達到相關(guān)應(yīng)用領(lǐng)域獲得最佳效率。 代碼分組和分段應(yīng)當根據(jù)用戶對信息的需求作格式安排, 要考慮在準確性和完備性方面進行查看的最大限度寬松性, 以及數(shù)據(jù)內(nèi)容的緊湊性。8 . 5 . 2 現(xiàn)有代碼的使用 宜使用現(xiàn)有的代碼。如果不是絕對需要, 就不必設(shè)計新的代碼。8 . 5 . 3代碼含義 在使用恰當時, 有含義代碼為附加信息提供了一個基礎(chǔ), 并且在人工使用方面比無含義代碼更加容易、 更為可靠些。然而, 在有含義代碼的開發(fā)過程中應(yīng)當謹慎, 以確保有含義的部分與穩(wěn)定的實體相關(guān)聯(lián)。例如, 當?shù)攸c的改變將會引起代碼的改變時, 某個組織的有含義代碼就不宜與地點相關(guān)聯(lián) 無含義代碼宜用于大多數(shù)標識目的以及所有的參照目的。8 _ 5 . 4 代碼字符數(shù)目的確定 代碼值應(yīng)當由最少的字符數(shù)目組成以節(jié)省空間并減少數(shù)據(jù)通信時間, 但同時還應(yīng)根據(jù)代碼用戶的能力進行優(yōu)化 固定長度代碼( 例如: 只采用氣位字符, 而不是一位、 二位和三位字符同時混用) 在使用上比叮變長度代碼更加可靠且更加容易。 為了記錄的可靠性, 多于 4位字母字符或 5位數(shù)字字符的代碼值宜分解成較小的代碼段, 例如:XXX- XXX一 XXXX就比XXXXXXXXXX更為可靠。 在不必對已有代碼元素重新編碼或者擴大編碼表達式格式的前提下, 代碼結(jié)構(gòu)應(yīng)當能為代碼集合增添新的代碼元素提供支持8 . 5 . 5代碼段的分隔 如果位置或代碼段是完全相互獨立并且能夠獨自成立( 即: 對于它們的含義來 說, 不需要其他的代碼) , 代碼段應(yīng)能被連字符( 當需要顯示時) 所隔離。85 . 6代碼的位置順序 如果一個編碼方案把一個完整實體集分成比較小的分組 , 那么高階位置應(yīng)當是顯著的、 全面的分類; 低階位置應(yīng)當最具選擇性和差別性( 包括后綴) 。一個例子就是 G B / T 7 4 0 8規(guī)定的日期數(shù)字表達式( Y Y Y Y MMDD ) 。如果一個復合代碼被設(shè)計成由兩個或更多的獨立代碼段組成, 則出現(xiàn)在高階位置上特有的代碼段應(yīng)當是基于慣用要求和處理效率來考慮的。8 . 5 . 7 代碼命名 代碼或其各個所有獨立的代碼段都必須有自己的標準化的、 唯一的、 與應(yīng)用標志相適應(yīng)的命名。B - 5 . 8 代碼容最計算 1 ( GB/ T 7 0 2 7 -2 0 0 2 在計算涵蓋全部位置的給定代碼容量并且要保持代碼唯一性時, 應(yīng)使用下列公式( 假定使用 2 4 個字母字符和1 0 個數(shù)值數(shù)字, 因為要避免使用字母 I 和O可能引起的混淆) : C=2 4 a1 0 式 中 : C 全部可能的有效代碼組合數(shù) , 即容量; A代碼中字母位置的數(shù)目; N代碼中數(shù)字位置的數(shù)目。 ( 在組合的情況下, A+N等于代碼的全部位置數(shù)目) 。 注: 上面的公式似定給定的位置要么是字母的, 要么是數(shù)字的, 但決不是二者都適用如果特定的位置允許字母字 符和數(shù)字字符二者都適用, 則公式變成為: C =2 6 1 0 3 6 或 C =2 4 1 0 , 3 4 ( 當字母I 和O被禁用時) 式中 M為代碼中字母字符和數(shù)字字符二者都適用的位置數(shù)目, A+N+M等于代碼的全部位置數(shù)目。 在計算容量時, 不應(yīng)考慮校驗碼所占的位置。8 - 5 . 9校驗碼 為了避免抄錄和鍵人過程中的錯誤, 當代碼較長時, 應(yīng)考慮設(shè)置校驗碼。校驗碼由構(gòu)成編碼表達式的字符經(jīng)過一定的算術(shù)運算而得到, 它可以檢測出以下類型的錯誤: a ) 單替代錯誤: 一個單一字符被另一個單一字符替換; b ) 單一對換錯誤: 單個字符的對換, 相鄰的( d =1 ) 兩個字符或相隔一個字符的( d =2 ) 兩個字符之間的互換錯誤 ; c ) 雙替代錯誤: 在同一個編碼表達式中, 兩個分隔的單一字符的替換錯誤; d ) 位移錯誤: 編碼表達式整體向左或向右的位移; e ) 其他錯誤。 參見 G B / T 1 7 7 1 0 ,8 . 6代碼 賦值約定8 . 6 . 1 賦碼規(guī) 則 賦碼規(guī)則應(yīng)敘述清晰并且具有一致的適用性。 例如: 一個助記縮寫詞可以通過從編碼

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權(quán),嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論