![第四講-元數(shù)據(jù)課件_第1頁](http://file4.renrendoc.com/view11/M02/24/1D/wKhkGWVv2sSAJ7AxAAGHp3vf_zc815.jpg)
![第四講-元數(shù)據(jù)課件_第2頁](http://file4.renrendoc.com/view11/M02/24/1D/wKhkGWVv2sSAJ7AxAAGHp3vf_zc8152.jpg)
![第四講-元數(shù)據(jù)課件_第3頁](http://file4.renrendoc.com/view11/M02/24/1D/wKhkGWVv2sSAJ7AxAAGHp3vf_zc8153.jpg)
![第四講-元數(shù)據(jù)課件_第4頁](http://file4.renrendoc.com/view11/M02/24/1D/wKhkGWVv2sSAJ7AxAAGHp3vf_zc8154.jpg)
![第四講-元數(shù)據(jù)課件_第5頁](http://file4.renrendoc.com/view11/M02/24/1D/wKhkGWVv2sSAJ7AxAAGHp3vf_zc8155.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第四講元數(shù)據(jù)12/6/20231信息管理系元數(shù)據(jù)(MetaData),就是“描述數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”。哈佛大學(xué)數(shù)字圖書館項目定義:元數(shù)據(jù)是幫助查找、存取、使用和管理信息資源的信息。一、元數(shù)據(jù)概念12/6/20232信息管理系具體:元數(shù)據(jù)是用來描述數(shù)據(jù)本身的內(nèi)容特征和其它特征的數(shù)據(jù),目地是加強對網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、識別、開發(fā)、組織和評價,而且對相關(guān)的信息資源進行選擇、定位、調(diào)用,追蹤資源在使用過程中的變化,實現(xiàn)信息資源的整合、有效管理和長期保存。12/6/20233信息管理系例如:文獻信息資源,元數(shù)據(jù)可以是目錄、索引、摘要及主題等文獻特征和屬性。從元數(shù)據(jù)的提供者角度來看,元數(shù)據(jù)能改進針對文檔的檢索能力,特別是搜索的精確度、以及對資源的控制和管理問題。對于電子文檔所存在的格式和控制方法多樣性問題,元數(shù)據(jù)能支持用戶決策過程。12/6/20234信息管理系DL信息體系結(jié)構(gòu)12/6/20235信息管理系元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata),此術(shù)語指任何用于幫助網(wǎng)絡(luò)電子資源的識別、描述和定位的數(shù)據(jù)。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù)(structureddataaboutdata)。12/6/20236信息管理系元數(shù)據(jù)是與對象相關(guān)的數(shù)據(jù),此數(shù)據(jù)使其潛在的用戶不必預(yù)先具備對這些對象的存在或特征的完整認(rèn)識。元數(shù)據(jù)是對信息包(Informationpackage)的編碼描述,其目的在于提供一個中間級別的描述,使得人們據(jù)此就可以做出選擇而無需檢索大量不相關(guān)的全文文本。12/6/20237信息管理系?元數(shù)據(jù),即代表性的數(shù)據(jù),通常被定義為數(shù)據(jù)之?dāng)?shù)據(jù)。它包含用于描述信息對象的內(nèi)容和位置的數(shù)據(jù)元素集,促進了網(wǎng)絡(luò)環(huán)境中信息對象的發(fā)展和檢索。12/6/20238信息管理系應(yīng)用于不同領(lǐng)域的Metadata格式
網(wǎng)絡(luò)資源:DublicCore、ROADSTemplate、CDF(ChannelDefinitionFormat)、WebCollections文獻資料:MARC(with856Field),DublicCore人文科學(xué):TEIHeader(TextEncodingInitiativeHeader)社會科學(xué)數(shù)據(jù)集:ICPSRSGMLCodebook(Inter-universityConsortiumforPoliticalandSocialResearch)博物館與藝術(shù)作品:CIMI(ComputerInterchangeofMuseumInformation)、CDWA(CategoriesfortheDescriptionofWorksofArts)、RLGREACHElementSet.12/6/20239信息管理系視覺資料:VRA(VisualResourcesAssociation)CoreCategoriesforVisualResources音樂資料:SMDL(StandardMusicDescriptionLanguage)政府信息:GILS(GovernmentInformationLocatorService)地理空間信息:FGDC/CSDGM(FederalGeographicDataCommittee/ContentStandardsforDigitalGeospatialMetadata)12/6/202310信息管理系數(shù)字圖像:MOA2metadata、CDLmetadata、OpenArchivesFormat、VRACore、NISO/CLIR/RLGTechnicalMetadataforImages檔案庫與資源集合:EAD(EncodingArchivalDescription)技術(shù)報告:RFC1807:AformatforBibliographicRecordsFTP文件和FTP文件庫:IAFATemplates(InternetAnonymousFTPArchivesTemplates)連續(xù)圖像:MPEG-712/6/202311信息管理系二、元數(shù)據(jù)的目的12/6/202312信息管理系12/6/202313信息管理系12/6/202314信息管理系12/6/202315信息管理系三、元數(shù)據(jù)結(jié)構(gòu)12/6/202316信息管理系12/6/202317信息管理系12/6/202318信息管理系12/6/202319信息管理系12/6/202320信息管理系3語義結(jié)構(gòu):12/6/202321信息管理系12/6/202322信息管理系12/6/202323信息管理系12/6/202324信息管理系12/6/202325信息管理系12/6/202326信息管理系12/6/202327信息管理系12/6/202328信息管理系12/6/202329信息管理系資源描述框架(ResourceDescriptionFramework)數(shù)據(jù)描述模式而且采用基于XML的句法提供語義、結(jié)構(gòu)、句法三個層次的互操作能力模塊化的互操作能力有些數(shù)據(jù)化信息需要不同的元數(shù)據(jù)描述,RDF對集成這些元數(shù)據(jù)非常有用。四、元數(shù)據(jù)描述框架RDF12/6/202330信息管理系RDF是一個與任何特定語法無關(guān)的抽象的資源表達模式,用來反映資源(Resource)、屬性(Property)與屬性值(Value)資源resource屬性property屬性值value語句statement12/6/202331信息管理系換言之…“張三是由以下網(wǎng)址所標(biāo)識的資源的作者:/tsgzz/99-3/p22.htm”/tsgzz/99-3/p22.htm作者author張三12/6/202332信息管理系/tsgzz/99-3/p22.htm作者author張三<rdf:RDF><rdf:Descriptionabout=”/tsgzz/99-3/p22.htm”><作者>張三</作者></rdf:Description></rdf:RDF>RDF基于XML的描述實例:RDF描述實例12/6/202333信息管理系/tsgzz/99-3/p22.htmDC:Creator張三DublinCore基于RDF的描述:<rdf:RDFxmlns:rdf="/1999/02/22-rdf-syntax-ns#"xmlns:dc="/dc/elements/1.0/">
<rdf:Descriptionabout=”/tsgzz/99-3/p22.htm”><dc:Creator>張三</dc:Creator></rdf:Description></rdf:RDF>基于RDF的DC描述實例12/6/202334信息管理系1)/1999/02/22-rdf-syntax-ns#RDF標(biāo)準(zhǔn)申明2)dc="/dc/elements/1.0/DC標(biāo)準(zhǔn)申明Notes:12/6/202335信息管理系五、元數(shù)據(jù)種類由于網(wǎng)上數(shù)字資源的形態(tài)各異,既有論文、會議錄等普通電子文本,也有圖像、聲音、網(wǎng)頁等,不同形式的數(shù)字資源對數(shù)據(jù)格式的要求也不一樣,因此現(xiàn)在有多種描述網(wǎng)絡(luò)數(shù)字資源的元數(shù)據(jù)格式,到目前為止還沒有出現(xiàn)成熟的統(tǒng)一格式。
兩種:Marc、DC12/6/202336信息管理系1MARC(Machine-ReadableCatalogue)元數(shù)據(jù)
機讀目錄格式MARC是圖書情報領(lǐng)域廣泛應(yīng)用的標(biāo)準(zhǔn)格式,國際通用的MARC標(biāo)準(zhǔn)為USMARC和UNIMARC標(biāo)準(zhǔn)。我國的MARC標(biāo)準(zhǔn)(CNMARC)是在UNIMARC標(biāo)準(zhǔn)的基礎(chǔ)上加以補充規(guī)定形成的。由于多語種圖書文獻的存在,目前我國的機讀書目數(shù)據(jù)實際上是以CNMARC和US-MARC為主,其他MARC格式為輔的現(xiàn)狀。12/6/202337信息管理系MARC格式可由四個部分組成,其中記錄頭標(biāo)區(qū)固定為24個字符長,為記錄處理提供基本參數(shù)。地址目次區(qū)由若干目次項組成,每個目次項為定長12個字符,標(biāo)識某MARC字段在整個MARC流中的位置。數(shù)據(jù)字段區(qū)由一些可變長的數(shù)據(jù)字段組成,除了001字段和005字段由數(shù)據(jù)和一個字段分隔符組成外,其余每個字段都有兩個指示符,后接若干子字段。12/6/202338信息管理系整個MARC數(shù)據(jù)流經(jīng)檢測有效才能成為書目數(shù)據(jù)庫的正式書目數(shù)據(jù)。MARC元數(shù)據(jù)格式——主要用于描述圖書文獻資源。12/6/202339信息管理系MARC局限性:
(1)MARC描述手段往往只適用于圖書館;(2)MARC需要在專門的軟件系統(tǒng)中使用,而且不太適應(yīng)互聯(lián)網(wǎng)的環(huán)境;(3)修訂程序相當(dāng)復(fù)雜,而且非常緩慢;(4)適用于完整的、靜止的信息內(nèi)容的處理,不易處理動態(tài)的多媒體信息;(5)編制一條機讀目錄不僅需要經(jīng)過嚴(yán)格的專門訓(xùn)練,而且需要花一定的時間。12/6/202340信息管理系
2、DC元數(shù)據(jù)簡介
1995年3月,在美國俄亥俄州的都柏林召開的第一屆元數(shù)據(jù)研討會上,52位來自圖書館界、電腦網(wǎng)絡(luò)界專家共同研究產(chǎn)生。目的是希望建立一套描述網(wǎng)絡(luò)電子文獻的方法,以便網(wǎng)上信息檢索。其中心議題是如何用一個簡單的元數(shù)據(jù)記錄來描述種類繁多的電子資源,使非圖書館專業(yè)人員都能夠了解和使用著錄格式,來描述網(wǎng)上資源。經(jīng)過與會代表的商討和辯論,產(chǎn)生了一個精簡的元數(shù)據(jù)集——都柏林核心元素集(DublinCoreElementSet),簡稱都柏林核心(DC)。
12/6/202341信息管理系DC由15個基本元素構(gòu)成。由于它具有簡練、易于理解、可擴展、能與其他元數(shù)據(jù)形式進行橋接等性能,能較好地解決網(wǎng)絡(luò)資源的發(fā)現(xiàn)、控制和管理問題,使它成為一個較好的網(wǎng)絡(luò)資源描述元數(shù)據(jù)集,已經(jīng)成為美國國家標(biāo)準(zhǔn),并正在逐步成為世界公認(rèn)的標(biāo)準(zhǔn)。12/6/202342信息管理系DC產(chǎn)生與發(fā)展屆次舉辦時間主辦國舉辦地主辦組織DC-11995.3美國Dublin,OhioOCLC、NCSADC-21996.4英國WarwickOCLC、UKOLNDC-31996.9美國Dublin,OhioOCLC、CNIDC-41997.3澳大利亞CanberraOCLC、DSTC、NLADC-51997.10芬蘭HelsinkiOCLC、NLFDC-61998.11美國WashingtonD.C.OCLC、TLCDC-71999.10德國FrankfurtOCLCDC-82000.10加拿大OttawaOCLC、CNI、IFLADC-92001.10日本TokyoOCLC、NII、JSTDC20022002.10意大利FlorenceOCLCDC20032003.9美國西雅圖OCLC12/6/202343信息管理系1)、DC元數(shù)據(jù)的類型12/6/202344信息管理系2)詳細(xì)描述12/6/202345信息管理系12/6/202346信息管理系12/6/202347信息管理系12/6/202348信息管理系12/6/202349信息管理系12/6/202350信息管理系12/6/202351信息管理系12/6/202352信息管理系3)DC修飾詞(分為兩類):(1)元素的進一步限制該類修飾詞使元素的含義更為狹窄或?qū)V?進一步限定的元素繼承了未限定元素的外延,便具有更為嚴(yán)格的內(nèi)涵。如果使用者不明白經(jīng)過進一步限定的術(shù)語的特指含義,可以忽略修飾詞,直接將它作為未修飾的元數(shù)據(jù)元素來理解。用于修飾元素的進一步限定的定義應(yīng)該可以方便的得到。12/6/202353信息管理系元素限定屬性說明TitleAlternative替代標(biāo)題Creater暫無限制屬性12/6/202354信息管理系12/6/202355信息管理系元素限定屬性說明SubjectLCSH國會圖書館主題詞表*MeSH國家醫(yī)學(xué)圖書館主題詞表*DDC杜威十進分類表*LCC國會圖書館分類表*UDC國際十進分類表*12/6/202356信息管理系12/6/202357信息管理系元素限定屬性說明DescriptiontableOfContents目次Abstract文摘Publisher暫無限制屬性12/6/202358信息管理系12/6/202359信息管理系12/6/202360信息管理系12/6/202361信息管理系12/6/202362信息管理系元素限定屬性說明Contributor暫無限制詞DateCreated制作日期Valid有效日期Available可獲得日期Issued發(fā)表日期Modified修改日期DCMIPeriodDCMI日期編碼*W3C-DTFW3C-DTF日期編碼*12/6/202363信息管理系12/6/202364信息管理系元素限定屬性說明TypeDCMITypeDCMI資源類別編碼*12/6/202365信息管理系12/6/202366信息管理系元素限定屬性說明FormatExtent資源范圍Medium物理載體IMTinternet資源格式*12/6/202367信息管理系12/6/202368信息管理系12/6/202369信息管理系12/6/202370信息管理系12/6/202371信息管理系12/6/202372信息管理系12/6/202373信息管理系12/6/202374信息管理系元素限定屬性說明IdentifierURI資源唯一標(biāo)識符號*12/6/202375信息管理系12/6/202376信息管理系12/6/202377信息管理系元素限定屬性說明Source暫無限制詞LanguageISO639-2ISO639-2語種代碼*RFC1766RFC1766語種代碼*12/6/202378信息管理系12/6/202379信息管理系12/6/202380信息管理系元素限定屬性說明RelationIsVersionOf是另一種資源的一個版本HasVersion有其他資源作為其他版本IsreplacedBy被另一資源取代RePlaces取代另一資源IsRequiredBy被另一資源所需要Requires需要一資源IsPartOf是另一資源的一部分HasPart有另一資源作為一部分IsReferencedBy被另一資源所參見12/6/202381信息管理系元素限定屬性說明RelationReferences參見另一資源IsFormatOf是另一資源的另一格式HasFormat有另外格式URI使用URI描述關(guān)聯(lián)資源*12/6/202382信息管理系12/6/202383信息管理系12/6/202384信息管理系12/6/202385信息管理系12/6/202386信息管理系12/6/202387信息管理系12/6/202388信息管理系12/6/202389信息管理系12/6/202390信息管理系12/6/202391信息管理系12/6/202392信息管理系12/6/202393信息管理系12/6/202394信息管理系12/6/202395信息管理系12/6/202396信息管理系12/6/202397信息管理系12/6/202398信息管理系12/6/202399信息管理系12/6/2023100信息管理系12/6/2023101信息管理系12/6/2023102信息管理系12/6/2023103信息管理系12/6/2023104信息管理系12/6/2023105信息管理系12/6/2023106信息管理系元素限定屬性說明Rights暫無限制詞12/6/2023107信息管理系元素限定屬性說明CoverageSpatial空間范圍DCMIPointDCMI空間坐標(biāo)系統(tǒng)*ISO3166ISO3166國家名稱代碼*DCMIBoxDCMI地理區(qū)限描述體系*TGNGetty地理名稱敘詞表*temporal時間范圍DCMIPeriodDCMI時期體系*W3C-DTFW3C-DTF時間編碼體系*12/6/2023108信息管理系12/6/2023109信息管理系12/6/2023110信息管理系12/6/2023111信息管理系12/6/2023112信息管理系12/6/2023113信息管理系(2)編碼體系該類修飾詞說明元素值所屬的編碼體系,以幫助理解值的含義。采用來自控制詞表的表征符號(例如分類法主題詞標(biāo)中的術(shù)語)具有特定意義,或以一定形式組成的字符串表示正規(guī)的符號。如果一種編碼體系無法被客戶機或代理所理解,它的值仍能被人類所理解。用于修飾的編碼體系必須有清晰明確的說明,并能夠方便的得到.12/6/2023114信息管理系DCMI自己的編碼規(guī)則:12/6/2023115信息管理系12/6/2023116信息管理系12/6/2023117信息管理系12/6/2023118信息管理系12/6/2023119信息管理系4)、DC的作用是:
(1)支持簡單而含有信息量的元數(shù)據(jù),以滿足廣大用戶和群體的需要。(2)提供一個共享語義學(xué)標(biāo)準(zhǔn),使得用各種不同規(guī)則編目的元數(shù)據(jù)可以直接交換。12/6/2023120信息管理系1)簡單性。DC是非專業(yè)層面提出來的,其目的是為網(wǎng)頁制作者提供一種網(wǎng)絡(luò)信息的著錄格式,以供用戶查找與定位所需信息。與傳統(tǒng)的目錄卡片及MARC格式相比,DC簡單。2)靈活性。DC的每一著錄項目都是可以選擇的,也是可以重復(fù)的。網(wǎng)絡(luò)制作人員可以根據(jù)網(wǎng)頁的內(nèi)容與特征選擇需要項目,允許不同專業(yè)團體根據(jù)專業(yè)要求對其進行調(diào)整。5)DC
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度美發(fā)店員工福利與薪酬承包合同
- 現(xiàn)代建筑的智能化隔音系統(tǒng)設(shè)計與實施
- 新教育形勢下學(xué)校與家庭的深度融合路徑研究
- 2024年血細(xì)胞分析試劑項目資金籌措計劃書代可行性研究報告
- 智能科技在小區(qū)化妝品銷售中的應(yīng)用及效果
- 2025年荊州理工職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年常考版參考題庫含答案解析
- 跨平臺媒體內(nèi)容創(chuàng)新的策略分析
- 2025年甘肅衛(wèi)生職業(yè)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025年漳州職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年??及鎱⒖碱}庫含答案解析
- 2025年湖南有色金屬職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 藥用植物種植制度和土壤耕作技術(shù)
- 《火力發(fā)電企業(yè)設(shè)備點檢定修管理導(dǎo)則》
- 重慶市渝北區(qū)2024年八年級下冊數(shù)學(xué)期末統(tǒng)考模擬試題含解析
- 保安服務(wù)項目信息反饋溝通機制
- 《團隊介紹模板》課件
- 常用中醫(yī)適宜技術(shù)目錄
- 沖壓模具價格估算方法
- 運動技能學(xué)習(xí)與控制課件第十一章運動技能的練習(xí)
- 蟲洞書簡全套8本
- 2023年《反電信網(wǎng)絡(luò)詐騙法》專題普法宣傳
- 小學(xué)數(shù)學(xué)五年級上、下冊口算題大全
評論
0/150
提交評論