關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第1頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第2頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第3頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第4頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思索Metadata(metadata,orsometimesmetainformation)is"dataaboutotherdata",ofanysortinanymedia.Anitemofmetadatamaydescribeanindividualdatum,orcontentitem,oracollectionofdataincludingmultiplecontentitemsandhierarchicallevels,forexampleadatabaseschema.Indataprocessing,metadataprovidesinformationabout,ordocumentationof,otherdatamanagedwithinanapplicationorenvironment.Thiscommonlydefinesthestructureorschemaoftheprimarydata.Thetermshouldbeusedwithcautionasalldataisaboutsomething,andistherefore"metadata"inasense,andviceversa.Forexample,metadatawoulddocumentdataaboutdataelementsorattributes,(name,size,datatype,etc)anddataaboutrecordsordatastructures(length,fields,columns,etc)anddataaboutdata(whereitislocated,howitisassociated,ownership,etc.).Metadatamayincludedescriptiveinformationaboutthecontext,qualityandcondition,orcharacteristicsofthedata.Itmayberecordedwithhighorlowgranularity.元數(shù)據(jù)〔Metadata〕,又稱中介資料,為描述數(shù)據(jù)的數(shù)據(jù)〔dataaboutdata〕,主要是描述數(shù)據(jù)屬性〔property〕的資訊,用來支持如指示儲存位置、歷史資料、資源尋找、文件紀(jì)錄等功能。元數(shù)據(jù)算是一種電子式目錄,為了達(dá)到編制目錄的目的,必必需在描述并收藏數(shù)據(jù)的內(nèi)容或特色,進而達(dá)成協(xié)助數(shù)據(jù)檢索的目的。都柏林核心集〔DublinCoreMetadataInitiative,DCMI〕是元數(shù)據(jù)的一種應(yīng)用,是1995年3月由國際圖書館電腦中心〔OCLC〕和美國國家超級計算應(yīng)用中心〔NationalCenterforSupercomputingApplications,NCSA〕所聯(lián)合贊助的研討會,在邀請52位來自圖書館管理員、電腦專家,共同制定規(guī)格,建立一套描述網(wǎng)絡(luò)上電子文件之特征。metadata也有人稱為后設(shè)資料,也有人稱metadata為元數(shù)據(jù)或詮釋資料等等。有關(guān)metadata名詞起源于1969年,有JackE.Myers所提出的.metadata即data-about-data,可以說是一種標(biāo)準(zhǔn),是為支援互通性的資料描述,所取得一致的準(zhǔn)則。Metadata的基本定義出自O(shè)CLC與NCSA所主辦的“MetadataWorkshop〞研討會。它將Metadata定義為“描述資料的資料〞〔Dataaboutdata〕.此后各種有關(guān)Metadata的定義紛紛的出現(xiàn)。現(xiàn)存很多metadata的定義,主要端視特定社群或使用情境而不同.如有有關(guān)資料的資料〔dataaboutdata〕,有關(guān)資訊物件之結(jié)構(gòu)的資訊〔structuredinformationaboutaninformationobject〕,描述資源屬性的資料〔Datadescribesattributesofresources〕等。依據(jù)國內(nèi)外眾位學(xué)者們對元數(shù)據(jù)的分析和描述,我們可以發(fā)現(xiàn)元數(shù)據(jù)具有以下特點。首先,它具有動態(tài)性。因為元數(shù)據(jù)是對文件的產(chǎn)生、保管、利用、銷毀等整個過程的真實性記錄,它隨著文件的產(chǎn)生而產(chǎn)生,伴隨人們對文件進行的各種管理活動而不斷地增加。其次,它具有多元性。本來在信息環(huán)境下針對不同的資源類型就已經(jīng)存在了多種元數(shù)據(jù)格式,人們往往為了不同層次或角度的應(yīng)用,又會產(chǎn)生各種各樣的元數(shù)據(jù)格式,從而積存下大量的、格式多樣的元數(shù)據(jù)。再次,它具有數(shù)量龐大性。一方面,為了全面真實地反映各種業(yè)務(wù)活動和個人活動,我們要從多個角度和層次來進行記錄;另一方面,為了完整地記錄文件管理的整個過程,我們必需要記錄下各種操作活動,必定會產(chǎn)生大量的元數(shù)據(jù)信息。明確了元數(shù)據(jù)的特點,我們就可以有針對性的采納一些方法和措施來進行逮住。在電子文件管理系統(tǒng)中,元數(shù)據(jù)一般是通過系統(tǒng)自動記錄與手工記錄相結(jié)合的方式獲得的。關(guān)于有些元數(shù)據(jù),我們可以預(yù)先制定好其所對應(yīng)的標(biāo)記,將它們標(biāo)志在所描述的對象上,如關(guān)于收文和發(fā)文可做不同的標(biāo)記,文件是否歸檔、對象是否是文件或是文件的一個組成部分、文件的密級、保管期限等。關(guān)于本單位系統(tǒng)發(fā)文,系統(tǒng)會自動彈出元數(shù)據(jù)項目供文件形成者填寫,像文件的題名、形成日期、起草人、形成部門、內(nèi)容提要等;關(guān)于外單位系統(tǒng)來文,系統(tǒng)會自動抽取所必需的上述相關(guān)信息。而文件的另一部分元數(shù)據(jù)項目則由系統(tǒng)自動生成,如所用的字體、版面格式、邏輯格式與系統(tǒng)的軟硬件說明等,而關(guān)于在電子文件利用過程中的利用信息也由系統(tǒng)自動記錄并作為元數(shù)據(jù)儲存。為確保較高的準(zhǔn)確性,元數(shù)據(jù)須保持緊跟現(xiàn)狀的變化。確保元數(shù)據(jù)準(zhǔn)確并維護合格的唯一方法就是盡可能使維護過程自動化。我們不必了解應(yīng)用程序系統(tǒng)編寫的狀況,就能看到只依賴過程來維護元數(shù)據(jù)的結(jié)果。一般元數(shù)據(jù)量通常都很大,最有用的方法是只收集變化,而不是定期刷新整個元數(shù)據(jù)集,特別是動態(tài)性很強的使用信息,應(yīng)定期追加而不是改變現(xiàn)有的信息。解素芳元數(shù)據(jù),從定義上講,是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者說是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)。元數(shù)據(jù)作為一個概念提出的時間并不長,但是元數(shù)據(jù)本身并不是一個新事物。自從有對人類所產(chǎn)生的信息與知識進行分析、分類與管理之日起,元數(shù)據(jù)就扮演了一個重要的角色。傳統(tǒng)的檢索工:具,像目錄卡片、案卷目錄、案卷封面、分類表等都屬于元數(shù)據(jù)的范疇,圖書的版權(quán)說明、磁盤的標(biāo)簽等也都是元數(shù)據(jù)。元數(shù)據(jù)這一概念起源于計算機科學(xué),由Myers在1960年提出,當(dāng)時是指能夠有效描述資料的方式,后來面對電子信息所特有的分散式、變動性與多元性,元數(shù)據(jù)再度引起更廣泛的關(guān)注,現(xiàn)在元數(shù)據(jù)研究的重點主要還是網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)的描述與數(shù)據(jù)管理問題。元數(shù)據(jù)可以處理各種形式的信息,包括還未電子化和電子化信息,特別是能較好地解決網(wǎng)絡(luò)環(huán)境—下信息的發(fā)現(xiàn)、控制和管理問題,因此目前已廣泛應(yīng)用于圖書館、檔案館、電子政務(wù)等領(lǐng)域。下面我主要談?wù)勲娮诱?wù)系統(tǒng)中元數(shù)據(jù)的應(yīng)用。當(dāng)前我國正在加緊實施電子政務(wù)建設(shè),面對大量而分散的政府信息資源,從政府機關(guān)的角度而言,如何組織、控制、管理網(wǎng)絡(luò)環(huán)境下的信息資源,并提供高效優(yōu)質(zhì)的信息服務(wù)是其努力的目標(biāo);對廣大用戶而言,如何利用網(wǎng)絡(luò)跨越政府機關(guān)多層組織的障礙,搜尋、推斷、獲取有價值的政府信息則是其關(guān)注的焦點。因此利用元數(shù)據(jù)對政府信息做更深一步的描述和管理,發(fā)展新一代獲取政府信息的檢索機制,顯得尤其重要。目前政府信息的元數(shù)據(jù)格式主要有兩種:GILS(GovernmentlnformationLocaterService,政府信息指引服務(wù))和DC(DublinCore,都柏林核心元數(shù)據(jù)集)。其中依照GILS發(fā)展信息指引服務(wù)的國家有美國、加拿大、日本等;而英國、澳大利亞、新西蘭等國在電子政務(wù)建設(shè)中,則是以DC為基礎(chǔ)制定了用于電子政務(wù)系統(tǒng)的元數(shù)據(jù)集。李新利目前,在檔案界關(guān)于元數(shù)據(jù)的解釋有很多種:國際檔案理事會《電子文件管理指南〔1997〕》中指出:“元數(shù)據(jù)是關(guān)于文件的背景信息和結(jié)構(gòu)的數(shù)據(jù)。〞澳大利亞《聯(lián)邦機構(gòu)電子文件管理元數(shù)據(jù)標(biāo)準(zhǔn)〔1999〕》對元數(shù)據(jù)的定義如下:“元數(shù)據(jù)是關(guān)于電子文件背景信息的著錄信息〞。英國國家檔案館〔電子文件管理指南〔1999〕〕中所提出的定義:“元數(shù)據(jù)是單份電子文件和文件組合的背景及其互相關(guān)系的結(jié)構(gòu)化著錄數(shù)據(jù)〞。從上面排列的定義可以看出,元數(shù)據(jù)與著錄信息或著錄數(shù)據(jù)之間有著密切的關(guān)系,但是,二者所描述的范圍是否完全等同呢?事實上,二者所描述的內(nèi)容范圍并不完全一致,而是互相交叉的:系統(tǒng)自動著錄的元數(shù)據(jù)中有些可以直接作為著錄信息,而有些著錄信息也是元數(shù)據(jù)未加描述的,如對文件內(nèi)容特征的概括說明等,而且,元數(shù)據(jù)的描述范圍要比電子文件的著錄范圍寬泛的多。國際社會就此還展開了一些電子文件元數(shù)據(jù)研究項目,形成了不同類型的元數(shù)據(jù)結(jié)構(gòu)體系〔有的稱為“元數(shù)據(jù)模板〞〕,如美國《匹茲堡大學(xué)元數(shù)據(jù)研究項目》;澳大利亞莫納西大學(xué)的蘇·麥克凱米什負(fù)責(zé)展開的《網(wǎng)絡(luò)化環(huán)境中為發(fā)揮信。3.求元數(shù)據(jù)的相關(guān)資料要英文和相應(yīng)的中文翻譯Metadata(metadata,orsometimesmetainformation)is"dataaboutotherdata",ofanysortinanymedia.Anitemofmetadatamaydescribeanindividualdatum,orcontentitem,oracollectionofdataincludingmultiplecontentitemsandhierarchicallevels,forexampleadatabaseschema.Indataprocessing,metadataprovidesinformationabout,ordocumentationof,otherdatamanagedwithinanapplicationorenvironment.Thiscommonlydefinesthestructureorschemaoftheprimarydata.Thetermshouldbeusedwithcautionasalldataisaboutsomething,andistherefore"metadata"inasense,andviceversa.Forexample,metadatawoulddocumentdataaboutdataelementsorattributes,(name,size,datatype,etc)anddataaboutrecordsordatastructures(length,fields,columns,etc)anddataaboutdata(whereitislocated,howitisassociated,ownership,etc.).Metadatamayincludedescriptiveinformationaboutthecontext,qualityandcondition,orcharacteristicsofthedata.Itmayberecordedwithhighorlowgranularity.元數(shù)據(jù)〔Metadata〕,又稱中介資料,為描述數(shù)據(jù)的數(shù)據(jù)〔dataaboutdata〕,主要是描述數(shù)據(jù)屬性〔property〕的資訊,用來支持如指示儲存位置、歷史資料、資源尋找、文件紀(jì)錄等功能。元數(shù)據(jù)算是一種電子式目錄,為了達(dá)到編制目錄的目的,必必需在描述并收藏數(shù)據(jù)的內(nèi)容或特色,進而達(dá)成協(xié)助數(shù)據(jù)檢索的目的。都柏林核心集〔DublinCoreMetadataInitiative,DCMI〕是元數(shù)據(jù)的一種應(yīng)用,是1995年3月由國際圖書館電腦中心〔OCLC〕和美國國家超級計算應(yīng)用中心〔NationalCenterforSupercomputingApplications,NCSA〕所聯(lián)合贊助的研討會,在邀請52位來自圖書館管理員、電腦專家,共同制定規(guī)格,建立一套描述網(wǎng)絡(luò)上電子文件之特征。metadata也有人稱為后設(shè)資料,也有人稱metadata為元數(shù)據(jù)或詮釋資料等等。有關(guān)metadata名詞起源于1969年,有JackE.Myers所提出的.metadata即data-about-data,可以說是一種標(biāo)準(zhǔn),是為支援互通性的資料描述,所取得一致的準(zhǔn)則。Metadata的基本定義出自O(shè)CLC與NCSA所主辦的“MetadataWorkshop〞研討會。它將Metadata定義為“描述資料的資料〞〔Dataaboutdata〕.此后各種有關(guān)Metadata的定義紛紛的出現(xiàn)?,F(xiàn)存很多metadata的定義,主要端視特定社群或使用情境而不同.如有有關(guān)資料的資料〔dataaboutdata〕,有關(guān)資訊物件之結(jié)構(gòu)的資訊〔structuredinformationaboutaninformationobject〕,描述資源屬性的資料〔Datadescribesattributesofresources〕等。企業(yè)參加制定標(biāo)準(zhǔn)具有一定的戰(zhàn)略意義。企業(yè)要收獲采納先進標(biāo)準(zhǔn)的效果,還必需充分發(fā)揮自身技術(shù)和體察市場敏銳的優(yōu)勢,積極參加到各層次標(biāo)準(zhǔn)化活動中,變被動的采納先進標(biāo)準(zhǔn)為主動地參加到國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)等層面的標(biāo)準(zhǔn)制定中,形成讓自己的技術(shù)主導(dǎo)市場的局面。有效地規(guī)避競爭提升競爭門檻淘汰不符合標(biāo)準(zhǔn)的企業(yè)提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論