信息資源組織與管理(第2版)PPT第02章信息的分類與編課件_第1頁
信息資源組織與管理(第2版)PPT第02章信息的分類與編課件_第2頁
信息資源組織與管理(第2版)PPT第02章信息的分類與編課件_第3頁
信息資源組織與管理(第2版)PPT第02章信息的分類與編課件_第4頁
信息資源組織與管理(第2版)PPT第02章信息的分類與編課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信息的分類與編碼《信息資源組織與管理》之第2講陳莊博士教授cz@12/21/20221信息的分類與編碼《信息資源組織與管理》之第2講陳莊博士內(nèi)容提要(1/2)2.1信息元素的涵義(了解:信息分類與編碼的最小單位)

2.1.1信息元素的概念2.1.2信息元素的命名原則2.1.3

信息元素的標(biāo)識2.1.4

信息元素的一致性2.2信息分類的方法

2.2.1信息分類的概念(了解)2.2.2

信息分類的基本原則(了解)2.2.3信息分類的基本方法(重點)

線分類法

面分類法

混合分類法12/21/20222內(nèi)容提要(1/2)12/18/20222內(nèi)容提要(2/2)2.3信息編碼方法

2.3.1

信息編碼的概念

2.3.2信息編碼的功能和信息編碼的基本原則(了解)2.3.3

代碼的分類(重點)

按符號形式分類

按符號的含義分類2.3.4編碼的校驗

錯誤種類(了解)校驗方法(重點)信息編碼錯誤的校驗步驟(重點)校驗案例(重點)

2.4

作業(yè)(…….)12/21/20223內(nèi)容提要(2/2)2.3信息編碼方法12/18/20222.1.1信息元素的概念信息元素(又稱數(shù)據(jù)元素或數(shù)據(jù)項)是最小的不可再分的信息單位,是一類信息的總稱。例如:船舶資料中的船名“天河輪”、“冀海輪”等,可以抽象出“船舶名稱”這個數(shù)據(jù)元素;每一條船都有一個編號,可以概括出“船舶編號”這個數(shù)據(jù)元素。通常職工檔案中的“簡歷”、“受獎情況”等,不是信息元素。因為“簡歷”至少包括時間、地點等信息,是可以繼續(xù)分解的信息;“受獎情況”也是可以繼續(xù)分解的信息。(注意:“信息元素”可以視為數(shù)據(jù)庫中的“字段”)12/21/202242.1.1信息元素的概念信息元素(又稱數(shù)據(jù)元素或數(shù)據(jù)項)是2.1.2信息元素的命名原則(1/2)1、命名原則信息元素命名的原則就是用一簡明的詞組來描述一個信息元素的意義和用途。

2、詞組的一般結(jié)構(gòu)類別詞和基本詞都只有—個,修飾詞可以有一個或多個;類別詞是信息元素命名中的—個最重要的名詞,用來識別和描述信息元素的一般用途或功能,一般不具有行業(yè)持征,條目較少。如數(shù)量(AMOUNT)、名稱(NAME)、編號(NUMBER)、代碼(CODE)等。基本詞是類別詞的最重要的修飾詞,它對一大類信息對象進(jìn)一步分類(反映一小類信息對象),一般具有行業(yè)特征,條目較多。如會計(ACCOUNTING)、預(yù)算(BUDGET)、顧客(CUSTOMER)等。修飾詞一基本詞一類別詞12/21/202252.1.2信息元素的命名原則(1/2)1、命名原則修飾詞一2.1.2信息元素的命名原則(2/2)3、信息元素命名案例社會保險編碼

社會(修飾詞)、保險(基本詞)、編號(類別詞)學(xué)校學(xué)生學(xué)號學(xué)校貴重設(shè)備名稱學(xué)校(修飾詞)、貴重(修飾詞)、設(shè)備(基本詞)、名稱(類別詞)12/21/202262.1.2信息元素的命名原則(2/2)3、信息元素命名案例2.1.3信息元素的標(biāo)識1、信息元素標(biāo)識的含義又稱信息元編碼是計算機和管理人員共同使用的標(biāo)識。2、信息元素標(biāo)識的方法用限定長度的大寫字母字符串表達(dá),字母字符可按信息元素名稱的漢語拼音抽取首音字字母,也可按英文詞首字母或縮寫規(guī)則得出。3、案例:12/21/202272.1.3信息元素的標(biāo)識1、信息元素標(biāo)識的含義12/18/2.1.4信息元素的一致性信息元素命名和信息元素標(biāo)識要在組織(政府部門或企事業(yè)單位)中保持一致。不允許有“同名異義”的信息元素。也不允許有“同義異名”的信息元素。這里的”名”是指信息元素的標(biāo)識;“義”是指信息元素的命名或定義。12/21/202282.1.4信息元素的一致性信息元素命名和信息元素標(biāo)識要在組2.2.1信息分類的概念(1/2)1、含義信息分類是根據(jù)信息內(nèi)容的屬性或特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立起一定的分類體系和排列順序。2、信息分類的兩個要素分類對象,分類對象由若干個被分類的實體組成;分類依據(jù),分類依據(jù)取決于分類對象的屬性或特征。12/21/202292.2.1信息分類的概念(1/2)1、含義12/18/202.2.2信息分類的基本原則(1/3)

1、科學(xué)性使類別的劃分符合信息的內(nèi)涵、性質(zhì)及使用與管理要求;選擇信息的本質(zhì)屬性和特征作為分類的依據(jù),使分類體系結(jié)構(gòu)具有穩(wěn)定性,以供人們方便地使用。

2、系統(tǒng)性分類結(jié)構(gòu)中各類信息按照他們之間的相互聯(lián)系排成一定的順序,形成一個系統(tǒng),既便于人們區(qū)分信息、識別信息,又便于人們從整體上去把握信息之間的關(guān)系。

12/21/2022102.2.2信息分類的基本原則(1/3)1、科學(xué)性12/12.2.2信息分類的基本原則(2/3)3、可擴展性隨著科學(xué)技術(shù)的進(jìn)步和社會經(jīng)濟的發(fā)展,人們可利用的信息量急劇增長,信息的類別和分類體系結(jié)構(gòu)也應(yīng)適應(yīng)這種變化的需要,這就要求:分類體系結(jié)構(gòu)在原有的基礎(chǔ)上有擴展的余地,其中包括新的類別的增補和在原有類別的基礎(chǔ)上進(jìn)行分解、細(xì)化。4、兼容性信息的分類是一個龐大而復(fù)雜的系統(tǒng),這個大系統(tǒng)中存在著若干層分系統(tǒng)與子系統(tǒng),一些子系統(tǒng)之間存在著相互聯(lián)系和信息共享問題:如生產(chǎn)類信息和人事類信息中都包含工人這一類信息。生產(chǎn)類信息在對工人這一信息的定義和再分類時就要和人事類信息兼容12/21/2022112.2.2信息分類的基本原則(2/3)12/18/202212.2.2信息分類的基本原則(3/3)5、實用性由于信息的屬性與特征的多樣性,在實際生活中選擇何種屬性與特征進(jìn)行分類還要考慮到人們實際應(yīng)用的需要。例如:某企業(yè)在開發(fā)新產(chǎn)品時,管理部門、設(shè)計部門與制造部門從各自的應(yīng)用目的出發(fā),對信息的分類會提出不同的要求。管理部門從企業(yè)的經(jīng)營管理目標(biāo)出發(fā),希望信息的分類要便于生產(chǎn)的計劃與控制,并能反映成本和市場需求方面的情況;設(shè)計部門則從設(shè)計需要出發(fā),希望信息的分類體系體現(xiàn)新產(chǎn)品開發(fā)組合化(模塊化)、標(biāo)準(zhǔn)化、序列化的趨勢;制造工藝部門則從實現(xiàn)產(chǎn)品的小批量、多品種成組生產(chǎn),以提高生產(chǎn)效率和質(zhì)量的目的出發(fā),希望信息的分類體系能反映產(chǎn)品的量、部件的幾何特征與工藝特性。因此,在制訂企業(yè)信息分類體系時,要從企業(yè)的總體目標(biāo)出發(fā),充分考慮到各部門的合理要求,進(jìn)行企業(yè)信息分類體系的整體優(yōu)化。12/21/2022122.2.2信息分類的基本原則(3/3)12/18/20線分類法(1/3)1、線分類法的基本思想線分類法(又稱等級分類法或?qū)蛹壏诸惙ǎ┦菍⒊跏嫉姆诸悓ο?即被劃分的事物或概念)按所選定的若干個屬性/特征作為分類的劃分基礎(chǔ),逐次地分解成若干個層級類目,并編排成一個逐級展開、有層次的分類體系。同層級類目之間存在著并列關(guān)系,稱為同位類。一個層級類目經(jīng)分解形成的下層類目,稱為下位類;相應(yīng)的被分解的類目稱為上位類;上位類與下位類的關(guān)系是隸屬關(guān)系。同層級類目互不重復(fù),不同層級的類目互不交叉。每個下位層的類目只對應(yīng)于一個上位層。12/21/2022線分類法(1/3)1、線分類法的基本思線分類法(2/3)2、線分類法的典型案例國家標(biāo)準(zhǔn)有《中華人民共和國行政區(qū)劃代碼》(GB/T2260—1999)(以下為河北省部分案例)其他案例:《國民經(jīng)濟行業(yè)分類與代碼》(GB/T4754—1994)和《職業(yè)分類與代碼》(GB/T6565—1999)

12/21/2022線分類法(2/3)2、線分類法的典型案線分類法(3/3)

3、線分類法的優(yōu)缺點優(yōu)點:容量大??扇菁{較多類目的信息。結(jié)構(gòu)清晰。采用樹形結(jié)構(gòu)能較好反映類目之間的邏輯關(guān)系。使用方便。既符合手工處理信息的思維習(xí)慣,又便于計算機處理。缺點:結(jié)構(gòu)彈性較差。分類結(jié)構(gòu)一經(jīng)確定,不易改動。效率較低。當(dāng)分類層次較多時,編碼的位數(shù)較長,影響數(shù)據(jù)處理速度。12/21/2022線分類法(3/3)3、線分類法的優(yōu)缺點面分類法(1/2)1、面分類法的基本思想面分類法是將所選定的分類對象的若干屬性或特征視為若干個“面”,每個“面”中又可分成彼此獨立的若干個類目。。使用時:可根據(jù)需要將這些“面”中的類目組合在一起,形成一個復(fù)合類目。2、面分類法的典型案例某高校教師分類編碼12/21/2022面分類法(1/2)1、面分類法的基本思想面分類法(2/2)3、面分類法的優(yōu)缺點優(yōu)點:具有較大的彈性。一個面內(nèi)的屬性內(nèi)容與數(shù)量的調(diào)整不會影響其他的面。適應(yīng)性強??筛鶕?jù)需要組成任何類目,也便于機器處理。易于增、刪、改。

缺點:不能充分利用信息。在面分類法形成的分類體系中,可組成的類目很多,但有時實際應(yīng)用的類別不多。用手工來組成信息類目比較困難。

12/21/2022面分類法(2/2)3、面分類法的優(yōu)缺點混合分類法1、混合分類法的基本思想混合分類法是將線分類法和面分類法組合使用,以其中一種分類法為主,另一種做補充的信息分類方法。2、案例:上述教師的面分類體系中的從事專業(yè),又可以分為學(xué)科門類(如管理學(xué)、工學(xué)等),學(xué)科門類下設(shè)若干一級學(xué)科,每個一級學(xué)科一般設(shè)有若干二級學(xué)科。這樣,從事專業(yè)這一面可按線分類法分成學(xué)科門類、一級學(xué)科、二級學(xué)科三個層次,如下表所示。其中,一級學(xué)科用三位數(shù)字表示,二級學(xué)科用兩位數(shù)字表示;一、二級學(xué)科之間用點隔開。

12/21/2022混合分類法1、混合分類法的基本思想12/2.3.1信息編碼的概念信息編碼是將事物或概念(編碼對象)賦予具有一定規(guī)律、易于計算機和人識別處理的符號,形成代碼元素集合。代碼元素集合中的代碼元素就是賦予編碼對象的符號,即編碼對象的代碼值。信息編碼包含數(shù)據(jù)表達(dá)成代碼的方法、數(shù)據(jù)的代碼表示形式、代碼元素集合的賦值。信息編碼形式有多種,例如:國際莫爾斯電報碼用小點與短橫表示。國際通用的電阻元件參數(shù)值是用一組由不同顏色組成的圓環(huán)表示的,稱為電阻色環(huán)碼。

信息編碼的概念12/21/2022192.3.1信息編碼的概念信息編碼的概念12/18/2022.3.2信息代碼的功能和信息編碼的基

本原則(1/2)代碼的功能如下:①信息的標(biāo)識唯一,便于分類鑒別,防止同名異義、異名同義現(xiàn)象發(fā)生。②信息的標(biāo)識統(tǒng)一,便于信息交換與利用,實現(xiàn)更大范圍的資源共享。③信息的標(biāo)識有序,便于信息的加工、排序、查詢、檢索。④信息的標(biāo)識明確,可以表達(dá)特定含義。⑤信息的標(biāo)識簡潔,可以提高信息處理的效率。⑥信息標(biāo)識的形式與信息內(nèi)容的對應(yīng)關(guān)系可以人為設(shè)定,有利于信息的安全保密。對信息進(jìn)行編碼,就是使信息的標(biāo)識規(guī)范化的過程,代碼就是信息規(guī)范化的標(biāo)識符。12/21/2022202.3.2信息代碼的功能和信息編碼的基

本原則(1/2)2.3.2信息代碼的功能和信息編碼的基

本原則(2/2)信息編碼的基本原則如下:

①唯一性。②合理性。③可擴展性。④簡潔性。⑤可識別性。⑥規(guī)范性。⑦穩(wěn)定性。

注意:企業(yè)代碼由技術(shù)監(jiān)督局、工商管理局負(fù)責(zé)給定;人口代碼(身份證)由公安局給定12/21/2022212.3.2信息代碼的功能和信息編碼的基

本原則(2/2)信2.3.3代碼的分類

12/21/2022222.3.3代碼的分類12/18/2022按符號形式分類(1/3)1、數(shù)字型代碼定義:數(shù)字型代碼或稱數(shù)字碼是用一個或多個阿拉伯?dāng)?shù)字表示分類對象的代碼。特點:優(yōu)點:結(jié)構(gòu)簡單,使用方便,特別是排序很容易,易于向國內(nèi)外推廣,缺點:但對于分類對象屬性與特征描述不直觀。案例:我國國家標(biāo)準(zhǔn)《人的性別代碼》《國民經(jīng)濟行業(yè)企業(yè)和代碼》《中華人民共和國行政區(qū)劃代碼》。

12/21/2022按符號形式分類(1/3)1、數(shù)字型代碼按符號形式分類(2/3)2、字母型代碼定義:字母型代碼或稱字母碼是用一個或多個字母表示分類對象的代碼。

優(yōu)點及案例:(1)字母型代碼與數(shù)字型代碼相比,同樣位數(shù)的代碼比數(shù)字型的容量大得多。案例:用一位英文字母型代碼最多可以表示26個(A-Z)類目,而一位數(shù)字型代碼最多只能表示10個類目,2位字母型代碼最多可表示26×26=676個類目。(2)字母型代碼由于其拼音字母的特點,還便于人們認(rèn)識代碼所表示的類目的內(nèi)容,方便人們的記憶。案例:用CN表示中國(China),BJ表示北京(Beijing)等.

缺點:對象數(shù)量較多時,或增補、修改代碼頻繁時,用字母型代碼容易出現(xiàn)重復(fù)與沖突現(xiàn)象。12/21/2022按符號形式分類(2/3)2、字母型代碼按符號形式分類(3/3)12/21/2022按符號形式分類(3/3)12/18/20按符號的含義分類(1/8)1、無含義代碼:指組成代碼的字符本身無實際含義的代碼,代碼只作為編碼對象的唯一標(biāo)識符。(1)順序碼定義:順序碼是將具有順序的數(shù)字或字母賦予編碼對象。順序碼是一種最簡單和常用的無含義代碼。優(yōu)點及案例:代碼簡短、使用方便、易于增補案例:國家標(biāo)準(zhǔn)《人的性別代碼》(GB/T2261—1980)中,男性的代碼是1,女性的代碼是2;學(xué)生學(xué)號編碼缺點:代碼本身不包含編碼對象任何其他信息,不便于標(biāo)識。12/21/20222按符號的含義分類(1/8)12/18/20按符號的含義分類(2/8)(2)無序碼定義:將無序的數(shù)字或字母賦予編碼對象的代碼。

特點:代碼無任何編寫規(guī)律,通??繖C器產(chǎn)生的隨機數(shù)賦予。此種代碼僅表示編碼對象是某約定的分類體系中的一個類目。案例:手機網(wǎng)上“自助服務(wù)”的有關(guān)密碼:一號通嗎、二次校驗碼。12/21/20222按符號的含義分類(2/8)(2)無序碼12/按符號的含義分類(3/8)2、有含義代碼:是指代碼不僅作為編碼對象的唯一標(biāo)識,代替編碼對象,而且提供編碼對象的分類、排序與邏輯意義等信息的代碼。(1)系列順序碼定義:這是一種特殊的順序碼。它是將順序代碼分成若干段(系列),并與編碼對象的分類一一對應(yīng),給每段的編碼對象賦予一定的順序。

特點:優(yōu)點是能表示一定的信息屬性或特征,易于添加;缺點是空碼較多,不便于機器處理,不適應(yīng)于復(fù)雜的分類體系。

12/21/20222按符號的含義分類(3/8)2、有含義代按符號的含義分類(4/8)(2)數(shù)字化字母順序碼定義:數(shù)字化字母順序碼是將編碼對象按其名稱的首字母順序排列,然后按此順序賦以遞增的數(shù)字代碼。特點:優(yōu)點:容易歸類,便于檢索,適合于根據(jù)人名、機關(guān)名、事業(yè)、企業(yè)單位名稱以及地名來檢索信息。缺點:新增代碼調(diào)整困難,使用時間較短。

案例(水果編碼)01Apples(蘋果)02Bananas(香蕉)03Chenies(櫻桃)04Dates(棗)

12/21/20222按符號的含義分類(4/8)(2)數(shù)字化字母順按符號的含義分類(5/8)(3)層次碼定義:層次碼常用于線分類法,它是按編碼對象的從屬層次關(guān)系為排列順序的一種代碼。編碼時,將代碼分成若干層級,并與分類對象的分類層級相對應(yīng)。代碼自左至右,表示的層級由高至低,每個層級的代碼可采用順序碼或系列順序碼。

特點:優(yōu)點:能明確表明編碼對象的類別,有嚴(yán)格的隸屬關(guān)系。代碼結(jié)構(gòu)簡單,容量大,便于計算機匯總。缺點:當(dāng)層次較多時,所用代碼位數(shù)較多,彈性較差。

案例:

(國家標(biāo)準(zhǔn)《國民經(jīng)濟行業(yè)分類和代碼》(GB/T4754—1994)編碼)采用三層四位數(shù)字的層級碼

12/21/202230按符號的含義分類(5/8)(3)層次碼12/按符號的含義分類(6/8)(4)特征組合碼定義:特征組合碼常用于面分類體系。它是將編碼對象按其屬性或特征分成若干個面。每個面內(nèi)的諸項屬性或特征按其規(guī)律分別進(jìn)行編碼,面與面之間的代碼沒有層次關(guān)系與從屬關(guān)系。使用時,按預(yù)先確定順序,根據(jù)需要可將不同的面中代碼組合起來以表示所代表的類目。特點(雷同于面分類法)優(yōu)點:類目組合比較靈活,適于機器處理。

缺點:利用率低,不便于求和匯總。

案例:機制螺釘分類由上表可知:代碼2342表示黃銅Φ1.5方形鍍鉻螺釘。

12/21/20223按符號的含義分類(6/8)(4)特征組合碼按符號的含義分類(7/8)(5)矩陣碼定義坐標(biāo)的代碼定義:矩陣碼是一種建立在多維空間坐標(biāo)位置基礎(chǔ)上的代碼,代碼的值是通過賦予多維空間坐標(biāo)的代碼組合而成,或是通過賦予多維空間位置的序號而構(gòu)成。例如:兩維矩陣嗎,是通過賦予x、y坐標(biāo)的數(shù)值(序號)確定代碼的值。

特點:優(yōu)點:邏輯關(guān)系明確,也容易解釋其含義。缺點:編制代碼時較困難,需要考慮建立一定的邏輯關(guān)系。

案例:國際標(biāo)準(zhǔn)ISO2711-73《順序日期表示法》行:月份;列:日期矩陣的序號排列(邏輯關(guān)系):從下至上、從左到右依次賦予001(1月1日)至365(12月31日)(若為閏年則為366)12/21/20223按符號的含義分類(7/8)(5)矩陣碼定義按符號的含義分類(8/8)(6)復(fù)合碼定義:復(fù)合碼是由兩個或兩個以上完整、獨立的代碼組合而成。

特點:優(yōu)點:使用靈活、應(yīng)用面較廣的代碼類型,可以表示具有復(fù)雜分類和標(biāo)識體系的事物。缺點:代碼總長度較長。

案例:

美國的物資編目代碼結(jié)構(gòu)圖(采用13位數(shù)字的復(fù)合碼)12/21/20223按符號的含義分類(8/8)(6)復(fù)合碼12/信息編碼錯誤種類1、在錄入代碼時的可能錯誤:識別錯誤:1/7,0/O,Z/2,D/O,S/5,……易位錯誤:12345/13245,……雙易位錯誤:12345/13254,……隨機錯誤:上述兩種或兩種以上的錯誤出現(xiàn)2、避免代碼錄入出現(xiàn)錯誤的辦法增加校驗位:在設(shè)計好的代碼后,再增加一位(最低位),作為代碼的組成部分。增加的一位,即為校驗位。使用中,沒有特別意義。使用方法:使用時,應(yīng)錄入包括校驗位在內(nèi)的完整代碼,代碼進(jìn)入系統(tǒng)后,系統(tǒng)將取該代碼校驗位前的各位,按照確定代碼校驗位的算法進(jìn)行計算,并與錄入代碼的最后一位(校驗位)進(jìn)行比較,如果相等,則錄入代碼正確,否則錄入代碼錯誤,進(jìn)行重新錄入。12/21/20223信息編碼錯誤種類1、在錄入代碼時的可能錯

信息編碼錯誤的校驗方法

(1/2)三種方法:算術(shù)級數(shù)法、幾何級數(shù)法、質(zhì)數(shù)法

1、算術(shù)級數(shù)法12/21/20223信息編碼錯誤的校驗方法

(1/2)三種方法信息編碼錯誤的校驗方法

(2/2)2、幾何級數(shù)法3、質(zhì)數(shù)法

12/21/20223信息編碼錯誤的校驗方法

(2/2)2、幾何信息編碼錯誤的校驗步驟設(shè)有一組代碼為:C1C2C3C4…Ci第一步:為設(shè)計好的代碼的每一位Ci確定一個權(quán)數(shù)Pi(權(quán)數(shù)可為算術(shù)級數(shù)-等差數(shù)列、幾何級數(shù)-等比數(shù)列、或質(zhì)數(shù))。第二步:求代碼每一位Ci與其對應(yīng)的權(quán)數(shù)Pi的成績之和SS=C1*P1+C2*P2+……+Ci*Pi(i=1,2,……,n)n=∑Ci*Pi(i=1,2,……,n)i=1第三步:確定模M第四步:取余R=MOD(M)第五步:校驗位Ci+1=R最終代碼為:C1C2C3C4…CiCi+1使用時:C1C2C3C4…CiCi+112/21/20223信息編碼錯誤的校驗步驟設(shè)有一組代碼為:C校驗案例

原設(shè)計的一組代碼為五位,如32456,確定權(quán)數(shù)為7,6,5,4,3(算數(shù)級數(shù))求代碼每一位Ci與其對應(yīng)的權(quán)數(shù)Pi的成績之和SS=C1*P1+C2*P2+……+Ci*Pi(i=1,2,……,n)=3*7+2*6+4*5+5*4+6*3=21+12+20+20+18=91確定模M,M=11取余R,R=SMOD(M)=91MOD(11)=3校驗位Ci+1=R=3最終代碼為:C1C2C3C4…CiCi+1,即324563使用時為:324563該組代碼中的其他代碼按此算法,分別求得校驗位,構(gòu)成新的代碼。其它案例:教材P4612/21/20223校驗案例原設(shè)計的一組代碼為五位,如32452.4作業(yè)P46:1,2,3,4,512/21/2022392.4作業(yè)P46:1,2,3,4,512/18/20223信息的分類與編碼《信息資源組織與管理》之第2講陳莊博士教授cz@12/21/202240信息的分類與編碼《信息資源組織與管理》之第2講陳莊博士內(nèi)容提要(1/2)2.1信息元素的涵義(了解:信息分類與編碼的最小單位)

2.1.1信息元素的概念2.1.2信息元素的命名原則2.1.3

信息元素的標(biāo)識2.1.4

信息元素的一致性2.2信息分類的方法

2.2.1信息分類的概念(了解)2.2.2

信息分類的基本原則(了解)2.2.3信息分類的基本方法(重點)

線分類法

面分類法

混合分類法12/21/202241內(nèi)容提要(1/2)12/18/20222內(nèi)容提要(2/2)2.3信息編碼方法

2.3.1

信息編碼的概念

2.3.2信息編碼的功能和信息編碼的基本原則(了解)2.3.3

代碼的分類(重點)

按符號形式分類

按符號的含義分類2.3.4編碼的校驗

錯誤種類(了解)校驗方法(重點)信息編碼錯誤的校驗步驟(重點)校驗案例(重點)

2.4

作業(yè)(…….)12/21/202242內(nèi)容提要(2/2)2.3信息編碼方法12/18/20222.1.1信息元素的概念信息元素(又稱數(shù)據(jù)元素或數(shù)據(jù)項)是最小的不可再分的信息單位,是一類信息的總稱。例如:船舶資料中的船名“天河輪”、“冀海輪”等,可以抽象出“船舶名稱”這個數(shù)據(jù)元素;每一條船都有一個編號,可以概括出“船舶編號”這個數(shù)據(jù)元素。通常職工檔案中的“簡歷”、“受獎情況”等,不是信息元素。因為“簡歷”至少包括時間、地點等信息,是可以繼續(xù)分解的信息;“受獎情況”也是可以繼續(xù)分解的信息。(注意:“信息元素”可以視為數(shù)據(jù)庫中的“字段”)12/21/2022432.1.1信息元素的概念信息元素(又稱數(shù)據(jù)元素或數(shù)據(jù)項)是2.1.2信息元素的命名原則(1/2)1、命名原則信息元素命名的原則就是用一簡明的詞組來描述一個信息元素的意義和用途。

2、詞組的一般結(jié)構(gòu)類別詞和基本詞都只有—個,修飾詞可以有一個或多個;類別詞是信息元素命名中的—個最重要的名詞,用來識別和描述信息元素的一般用途或功能,一般不具有行業(yè)持征,條目較少。如數(shù)量(AMOUNT)、名稱(NAME)、編號(NUMBER)、代碼(CODE)等?;驹~是類別詞的最重要的修飾詞,它對一大類信息對象進(jìn)一步分類(反映一小類信息對象),一般具有行業(yè)特征,條目較多。如會計(ACCOUNTING)、預(yù)算(BUDGET)、顧客(CUSTOMER)等。修飾詞一基本詞一類別詞12/21/2022442.1.2信息元素的命名原則(1/2)1、命名原則修飾詞一2.1.2信息元素的命名原則(2/2)3、信息元素命名案例社會保險編碼

社會(修飾詞)、保險(基本詞)、編號(類別詞)學(xué)校學(xué)生學(xué)號學(xué)校貴重設(shè)備名稱學(xué)校(修飾詞)、貴重(修飾詞)、設(shè)備(基本詞)、名稱(類別詞)12/21/2022452.1.2信息元素的命名原則(2/2)3、信息元素命名案例2.1.3信息元素的標(biāo)識1、信息元素標(biāo)識的含義又稱信息元編碼是計算機和管理人員共同使用的標(biāo)識。2、信息元素標(biāo)識的方法用限定長度的大寫字母字符串表達(dá),字母字符可按信息元素名稱的漢語拼音抽取首音字字母,也可按英文詞首字母或縮寫規(guī)則得出。3、案例:12/21/2022462.1.3信息元素的標(biāo)識1、信息元素標(biāo)識的含義12/18/2.1.4信息元素的一致性信息元素命名和信息元素標(biāo)識要在組織(政府部門或企事業(yè)單位)中保持一致。不允許有“同名異義”的信息元素。也不允許有“同義異名”的信息元素。這里的”名”是指信息元素的標(biāo)識;“義”是指信息元素的命名或定義。12/21/2022472.1.4信息元素的一致性信息元素命名和信息元素標(biāo)識要在組2.2.1信息分類的概念(1/2)1、含義信息分類是根據(jù)信息內(nèi)容的屬性或特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立起一定的分類體系和排列順序。2、信息分類的兩個要素分類對象,分類對象由若干個被分類的實體組成;分類依據(jù),分類依據(jù)取決于分類對象的屬性或特征。12/21/2022482.2.1信息分類的概念(1/2)1、含義12/18/202.2.2信息分類的基本原則(1/3)

1、科學(xué)性使類別的劃分符合信息的內(nèi)涵、性質(zhì)及使用與管理要求;選擇信息的本質(zhì)屬性和特征作為分類的依據(jù),使分類體系結(jié)構(gòu)具有穩(wěn)定性,以供人們方便地使用。

2、系統(tǒng)性分類結(jié)構(gòu)中各類信息按照他們之間的相互聯(lián)系排成一定的順序,形成一個系統(tǒng),既便于人們區(qū)分信息、識別信息,又便于人們從整體上去把握信息之間的關(guān)系。

12/21/2022492.2.2信息分類的基本原則(1/3)1、科學(xué)性12/12.2.2信息分類的基本原則(2/3)3、可擴展性隨著科學(xué)技術(shù)的進(jìn)步和社會經(jīng)濟的發(fā)展,人們可利用的信息量急劇增長,信息的類別和分類體系結(jié)構(gòu)也應(yīng)適應(yīng)這種變化的需要,這就要求:分類體系結(jié)構(gòu)在原有的基礎(chǔ)上有擴展的余地,其中包括新的類別的增補和在原有類別的基礎(chǔ)上進(jìn)行分解、細(xì)化。4、兼容性信息的分類是一個龐大而復(fù)雜的系統(tǒng),這個大系統(tǒng)中存在著若干層分系統(tǒng)與子系統(tǒng),一些子系統(tǒng)之間存在著相互聯(lián)系和信息共享問題:如生產(chǎn)類信息和人事類信息中都包含工人這一類信息。生產(chǎn)類信息在對工人這一信息的定義和再分類時就要和人事類信息兼容12/21/2022502.2.2信息分類的基本原則(2/3)12/18/202212.2.2信息分類的基本原則(3/3)5、實用性由于信息的屬性與特征的多樣性,在實際生活中選擇何種屬性與特征進(jìn)行分類還要考慮到人們實際應(yīng)用的需要。例如:某企業(yè)在開發(fā)新產(chǎn)品時,管理部門、設(shè)計部門與制造部門從各自的應(yīng)用目的出發(fā),對信息的分類會提出不同的要求。管理部門從企業(yè)的經(jīng)營管理目標(biāo)出發(fā),希望信息的分類要便于生產(chǎn)的計劃與控制,并能反映成本和市場需求方面的情況;設(shè)計部門則從設(shè)計需要出發(fā),希望信息的分類體系體現(xiàn)新產(chǎn)品開發(fā)組合化(模塊化)、標(biāo)準(zhǔn)化、序列化的趨勢;制造工藝部門則從實現(xiàn)產(chǎn)品的小批量、多品種成組生產(chǎn),以提高生產(chǎn)效率和質(zhì)量的目的出發(fā),希望信息的分類體系能反映產(chǎn)品的量、部件的幾何特征與工藝特性。因此,在制訂企業(yè)信息分類體系時,要從企業(yè)的總體目標(biāo)出發(fā),充分考慮到各部門的合理要求,進(jìn)行企業(yè)信息分類體系的整體優(yōu)化。12/21/2022512.2.2信息分類的基本原則(3/3)12/18/20線分類法(1/3)1、線分類法的基本思想線分類法(又稱等級分類法或?qū)蛹壏诸惙ǎ┦菍⒊跏嫉姆诸悓ο?即被劃分的事物或概念)按所選定的若干個屬性/特征作為分類的劃分基礎(chǔ),逐次地分解成若干個層級類目,并編排成一個逐級展開、有層次的分類體系。同層級類目之間存在著并列關(guān)系,稱為同位類。一個層級類目經(jīng)分解形成的下層類目,稱為下位類;相應(yīng)的被分解的類目稱為上位類;上位類與下位類的關(guān)系是隸屬關(guān)系。同層級類目互不重復(fù),不同層級的類目互不交叉。每個下位層的類目只對應(yīng)于一個上位層。12/21/20225線分類法(1/3)1、線分類法的基本思線分類法(2/3)2、線分類法的典型案例國家標(biāo)準(zhǔn)有《中華人民共和國行政區(qū)劃代碼》(GB/T2260—1999)(以下為河北省部分案例)其他案例:《國民經(jīng)濟行業(yè)分類與代碼》(GB/T4754—1994)和《職業(yè)分類與代碼》(GB/T6565—1999)

12/21/20225線分類法(2/3)2、線分類法的典型案線分類法(3/3)

3、線分類法的優(yōu)缺點優(yōu)點:容量大??扇菁{較多類目的信息。結(jié)構(gòu)清晰。采用樹形結(jié)構(gòu)能較好反映類目之間的邏輯關(guān)系。使用方便。既符合手工處理信息的思維習(xí)慣,又便于計算機處理。缺點:結(jié)構(gòu)彈性較差。分類結(jié)構(gòu)一經(jīng)確定,不易改動。效率較低。當(dāng)分類層次較多時,編碼的位數(shù)較長,影響數(shù)據(jù)處理速度。12/21/20225線分類法(3/3)3、線分類法的優(yōu)缺點面分類法(1/2)1、面分類法的基本思想面分類法是將所選定的分類對象的若干屬性或特征視為若干個“面”,每個“面”中又可分成彼此獨立的若干個類目。。使用時:可根據(jù)需要將這些“面”中的類目組合在一起,形成一個復(fù)合類目。2、面分類法的典型案例某高校教師分類編碼12/21/20225面分類法(1/2)1、面分類法的基本思想面分類法(2/2)3、面分類法的優(yōu)缺點優(yōu)點:具有較大的彈性。一個面內(nèi)的屬性內(nèi)容與數(shù)量的調(diào)整不會影響其他的面。適應(yīng)性強。可根據(jù)需要組成任何類目,也便于機器處理。易于增、刪、改。

缺點:不能充分利用信息。在面分類法形成的分類體系中,可組成的類目很多,但有時實際應(yīng)用的類別不多。用手工來組成信息類目比較困難。

12/21/20225面分類法(2/2)3、面分類法的優(yōu)缺點混合分類法1、混合分類法的基本思想混合分類法是將線分類法和面分類法組合使用,以其中一種分類法為主,另一種做補充的信息分類方法。2、案例:上述教師的面分類體系中的從事專業(yè),又可以分為學(xué)科門類(如管理學(xué)、工學(xué)等),學(xué)科門類下設(shè)若干一級學(xué)科,每個一級學(xué)科一般設(shè)有若干二級學(xué)科。這樣,從事專業(yè)這一面可按線分類法分成學(xué)科門類、一級學(xué)科、二級學(xué)科三個層次,如下表所示。其中,一級學(xué)科用三位數(shù)字表示,二級學(xué)科用兩位數(shù)字表示;一、二級學(xué)科之間用點隔開。

12/21/20225混合分類法1、混合分類法的基本思想12/2.3.1信息編碼的概念信息編碼是將事物或概念(編碼對象)賦予具有一定規(guī)律、易于計算機和人識別處理的符號,形成代碼元素集合。代碼元素集合中的代碼元素就是賦予編碼對象的符號,即編碼對象的代碼值。信息編碼包含數(shù)據(jù)表達(dá)成代碼的方法、數(shù)據(jù)的代碼表示形式、代碼元素集合的賦值。信息編碼形式有多種,例如:國際莫爾斯電報碼用小點與短橫表示。國際通用的電阻元件參數(shù)值是用一組由不同顏色組成的圓環(huán)表示的,稱為電阻色環(huán)碼。

信息編碼的概念12/21/2022582.3.1信息編碼的概念信息編碼的概念12/18/2022.3.2信息代碼的功能和信息編碼的基

本原則(1/2)代碼的功能如下:①信息的標(biāo)識唯一,便于分類鑒別,防止同名異義、異名同義現(xiàn)象發(fā)生。②信息的標(biāo)識統(tǒng)一,便于信息交換與利用,實現(xiàn)更大范圍的資源共享。③信息的標(biāo)識有序,便于信息的加工、排序、查詢、檢索。④信息的標(biāo)識明確,可以表達(dá)特定含義。⑤信息的標(biāo)識簡潔,可以提高信息處理的效率。⑥信息標(biāo)識的形式與信息內(nèi)容的對應(yīng)關(guān)系可以人為設(shè)定,有利于信息的安全保密。對信息進(jìn)行編碼,就是使信息的標(biāo)識規(guī)范化的過程,代碼就是信息規(guī)范化的標(biāo)識符。12/21/2022592.3.2信息代碼的功能和信息編碼的基

本原則(1/2)2.3.2信息代碼的功能和信息編碼的基

本原則(2/2)信息編碼的基本原則如下:

①唯一性。②合理性。③可擴展性。④簡潔性。⑤可識別性。⑥規(guī)范性。⑦穩(wěn)定性。

注意:企業(yè)代碼由技術(shù)監(jiān)督局、工商管理局負(fù)責(zé)給定;人口代碼(身份證)由公安局給定12/21/2022602.3.2信息代碼的功能和信息編碼的基

本原則(2/2)信2.3.3代碼的分類

12/21/2022612.3.3代碼的分類12/18/2022按符號形式分類(1/3)1、數(shù)字型代碼定義:數(shù)字型代碼或稱數(shù)字碼是用一個或多個阿拉伯?dāng)?shù)字表示分類對象的代碼。特點:優(yōu)點:結(jié)構(gòu)簡單,使用方便,特別是排序很容易,易于向國內(nèi)外推廣,缺點:但對于分類對象屬性與特征描述不直觀。案例:我國國家標(biāo)準(zhǔn)《人的性別代碼》《國民經(jīng)濟行業(yè)企業(yè)和代碼》《中華人民共和國行政區(qū)劃代碼》。

12/21/20226按符號形式分類(1/3)1、數(shù)字型代碼按符號形式分類(2/3)2、字母型代碼定義:字母型代碼或稱字母碼是用一個或多個字母表示分類對象的代碼。

優(yōu)點及案例:(1)字母型代碼與數(shù)字型代碼相比,同樣位數(shù)的代碼比數(shù)字型的容量大得多。案例:用一位英文字母型代碼最多可以表示26個(A-Z)類目,而一位數(shù)字型代碼最多只能表示10個類目,2位字母型代碼最多可表示26×26=676個類目。(2)字母型代碼由于其拼音字母的特點,還便于人們認(rèn)識代碼所表示的類目的內(nèi)容,方便人們的記憶。案例:用CN表示中國(China),BJ表示北京(Beijing)等.

缺點:對象數(shù)量較多時,或增補、修改代碼頻繁時,用字母型代碼容易出現(xiàn)重復(fù)與沖突現(xiàn)象。12/21/20226按符號形式分類(2/3)2、字母型代碼按符號形式分類(3/3)12/21/20226按符號形式分類(3/3)12/18/20按符號的含義分類(1/8)1、無含義代碼:指組成代碼的字符本身無實際含義的代碼,代碼只作為編碼對象的唯一標(biāo)識符。(1)順序碼定義:順序碼是將具有順序的數(shù)字或字母賦予編碼對象。順序碼是一種最簡單和常用的無含義代碼。優(yōu)點及案例:代碼簡短、使用方便、易于增補案例:國家標(biāo)準(zhǔn)《人的性別代碼》(GB/T2261—1980)中,男性的代碼是1,女性的代碼是2;學(xué)生學(xué)號編碼缺點:代碼本身不包含編碼對象任何其他信息,不便于標(biāo)識。12/21/20226按符號的含義分類(1/8)12/18/20按符號的含義分類(2/8)(2)無序碼定義:將無序的數(shù)字或字母賦予編碼對象的代碼。

特點:代碼無任何編寫規(guī)律,通常靠機器產(chǎn)生的隨機數(shù)賦予。此種代碼僅表示編碼對象是某約定的分類體系中的一個類目。案例:手機網(wǎng)上“自助服務(wù)”的有關(guān)密碼:一號通嗎、二次校驗碼。12/21/20226按符號的含義分類(2/8)(2)無序碼12/按符號的含義分類(3/8)2、有含義代碼:是指代碼不僅作為編碼對象的唯一標(biāo)識,代替編碼對象,而且提供編碼對象的分類、排序與邏輯意義等信息的代碼。(1)系列順序碼定義:這是一種特殊的順序碼。它是將順序代碼分成若干段(系列),并與編碼對象的分類一一對應(yīng),給每段的編碼對象賦予一定的順序。

特點:優(yōu)點是能表示一定的信息屬性或特征,易于添加;缺點是空碼較多,不便于機器處理,不適應(yīng)于復(fù)雜的分類體系。

12/21/20226按符號的含義分類(3/8)2、有含義代按符號的含義分類(4/8)(2)數(shù)字化字母順序碼定義:數(shù)字化字母順序碼是將編碼對象按其名稱的首字母順序排列,然后按此順序賦以遞增的數(shù)字代碼。特點:優(yōu)點:容易歸類,便于檢索,適合于根據(jù)人名、機關(guān)名、事業(yè)、企業(yè)單位名稱以及地名來檢索信息。缺點:新增代碼調(diào)整困難,使用時間較短。

案例(水果編碼)01Apples(蘋果)02Bananas(香蕉)03Chenies(櫻桃)04Dates(棗)

12/21/20226按符號的含義分類(4/8)(2)數(shù)字化字母順按符號的含義分類(5/8)(3)層次碼定義:層次碼常用于線分類法,它是按編碼對象的從屬層次關(guān)系為排列順序的一種代碼。編碼時,將代碼分成若干層級,并與分類對象的分類層級相對應(yīng)。代碼自左至右,表示的層級由高至低,每個層級的代碼可采用順序碼或系列順序碼。

特點:優(yōu)點:能明確表明編碼對象的類別,有嚴(yán)格的隸屬關(guān)系。代碼結(jié)構(gòu)簡單,容量大,便于計算機匯總。缺點:當(dāng)層次較多時,所用代碼位數(shù)較多,彈性較差。

案例:

(國家標(biāo)準(zhǔn)《國民經(jīng)濟行業(yè)分類和代碼》(GB/T4754—1994)編碼)采用三層四位數(shù)字的層級碼

12/21/20226按符號的含義分類(5/8)(3)層次碼12/按符號的含義分類(6/8)(4)特征組合碼定義:特征組合碼常用于面分類體系。它是將編碼對象按其屬性或特征分成若干個面。每個面內(nèi)的諸項屬性或特征按其規(guī)律分別進(jìn)行編碼,面與面之間的代碼沒有層次關(guān)系與從屬關(guān)系。使用時,按預(yù)先確定順序,根據(jù)需要可將不同的面中代碼組合起來以表示所代表的類目。特點(雷同于面分類法)優(yōu)點:類目組合比較靈活,適于機器處理。

缺點:利用率低,不便于求和匯總。

案例:機制螺釘分類由上表可知:代碼2342表示黃銅Φ1.5方形鍍鉻螺釘。

12/21/202270按符號的含義分類(6/8)(4)特征組合碼按符號的含義分類(7/8)(5)矩陣碼定義坐標(biāo)的代碼定義:矩陣碼是一種建立在多維空間坐標(biāo)位置基礎(chǔ)上的代碼,代碼的值是通過賦予多維空間坐標(biāo)的代碼組合而成,或是通過賦予多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論