




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、元數(shù)據(jù)抽象模型與新加坡框架劉煒上海圖書(shū)館 2019數(shù)字圖書(shū)館建設(shè)與應(yīng)用研討會(huì)數(shù)字圖書(shū)館建設(shè)與應(yīng)用研討會(huì)*深圳深圳 主要內(nèi)容DC元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系DC元數(shù)據(jù)抽象模型DC元數(shù)據(jù)新加坡框架:應(yīng)用綱要的規(guī)范形式闡明:Google圖片搜索對(duì)此slide亦有貢獻(xiàn)DC元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系Element | DCMES, DCQElement |DCAMDCAP (DCTerms+) DC1.0 DC2.0DC1.0Elements元素Qualifiers修飾詞Element Refinements元素修飾詞(子元素)Encoding Schemes編碼體系修飾詞Vocabulary Encoding Sche
2、mes詞表編碼體系Syntax Encoding Schemes語(yǔ)法編碼體系 參見(jiàn):/usage/documents/principles/#elementDC應(yīng)用綱要1.0CWA14855定義指南性文檔沒(méi)有對(duì)于元數(shù)據(jù)編碼的任何規(guī)定不支持DCAM不支持Description Set (描述集)DC眼中的世界(DCAM)任何事物都是資源資源有類(lèi)型任何資源都可以以URI標(biāo)識(shí)任何資源都有屬性屬性詞即元數(shù)據(jù)屬性詞表即元數(shù)據(jù)方案元數(shù)據(jù)方案可有多種形式:不/半/規(guī)范的應(yīng)用綱要是一種正在成型的半/規(guī)范形式任何屬性都有屬性值屬性值有領(lǐng)域和范圍(domain & range)
3、屬性值可以是另一個(gè)資源,可以是文字(literal)取值的規(guī)范控制,即各類(lèi)KOS,也是元數(shù)據(jù)DCMI類(lèi)型詞表(DCTYPE)DC元數(shù)據(jù)描述的資源對(duì)象可能存在的類(lèi)型:CollectionDatasetEventImageMovingImageStillImageInteractiveResourcePhysicalObjectServiceSoftwareText“資源的唯一必備屬性:URIURI:Uniform Resource Identifier (RFC3986定義)唯一必備功能:標(biāo)識(shí)資源(無(wú)論是物理的還是抽象的);包含三部分: 訪問(wèn)資源的命名機(jī)制存放資源的主機(jī)名資源自身的名稱(chēng),由路徑表
4、示兩種類(lèi)型:URL 如:/rfc/rfc3986.txt mailto:java-netjava.sunnews:comp.lang.java URN 如:urn:isbn:096139210 xurn:doi:10.1045/november2019-kaufmanURI是抽象類(lèi),并不規(guī)定解析進(jìn)一步說(shuō)明元數(shù)據(jù)是一種人工語(yǔ)言消除歧義、明確定義、人機(jī)共讀);元數(shù)據(jù)元素集是描述資源各個(gè)方面的屬性詞表;元數(shù)據(jù)取值如果規(guī)定只能從某些詞表中選取,這些詞表就屬于受控的規(guī)范詞表;這屬于元素取值的domain和range;元數(shù)據(jù)應(yīng)用綱要是為了領(lǐng)域應(yīng)用而制訂的元數(shù)據(jù)方案的一種表達(dá)形式,目前正在成
5、為規(guī)范的,叫做“DC元數(shù)據(jù)應(yīng)用綱要”,核心是符合DC抽象模型的元數(shù)據(jù)形式化表述也就是一種機(jī)讀形式),通常可以以RDF形式表達(dá);應(yīng)用模型規(guī)定應(yīng)用領(lǐng)域的各類(lèi)實(shí)體及其相互關(guān)系)、著錄規(guī)則等文檔,也可以成為元數(shù)據(jù)應(yīng)用綱要的組成部分;元數(shù)據(jù)注冊(cè)系統(tǒng)可以作為元數(shù)據(jù)元素的命名域管理體系而存在,但命名域并非一定需要注冊(cè)系統(tǒng)進(jìn)行管理;元數(shù)據(jù)元素詞表,包括規(guī)定元數(shù)據(jù)取值的規(guī)范詞表,都可以看成是一種人工語(yǔ)言,每個(gè)術(shù)語(yǔ)都應(yīng)該被賦予唯一的URI,都可以通過(guò)注冊(cè)系統(tǒng)進(jìn)行管理;元數(shù)據(jù)形式化的表達(dá)必須采用基于XML的RDF或OWL等的Schema,著錄工作單當(dāng)然可以通過(guò)完整表達(dá)元數(shù)據(jù)方案各種關(guān)系和約束的schema來(lái)自動(dòng)生成
6、,并進(jìn)行校驗(yàn)。當(dāng)然這需要一定的環(huán)境和軟件工具來(lái)實(shí)現(xiàn) Resource haspropertyDC:CreatorDC:TitleDC:SubjectDC:Date.X主語(yǔ)謂詞屬性詞屬性值optional qualifieroptional qualifier修飾/限定詞來(lái)自(from):Stuart WeibelResource hasDate2000-06-13RevisedISO8601Resource hasSubjectLanguages - GrammarLCSH來(lái)自(from):Stuart WeibelDC屬性元素的“領(lǐng)域和范圍(Domain and Range)”見(jiàn):dubli
7、/documents/domain-range/index.shtmlRecord (encoded as html, XML, or RDF/XMLDescription setResource Description (URI)Resource Description (URI)Resource Description (URI)Statement Statement Statement language (pt-BR)DCAM圖示(來(lái)自Andy Powell)value stringvalue URIproperty (URI)syntax encodingscheme
8、Vocabulary encoding scheme新加坡框架進(jìn)一步定義了DC應(yīng)用綱要符合DC抽象模型(DCAM)的應(yīng)用綱要 (“DC應(yīng)用綱要”) 包含如下一系列文檔:功能需求說(shuō)明(必須desirable)領(lǐng)域模型 (應(yīng)有mandatory)元素集描述 (DSP) (應(yīng)有mandatory)應(yīng)用指南 (可選)編碼句法指南(可選)應(yīng)用指南功能需求領(lǐng)域模型元素集描畫(huà)編碼指南與數(shù)據(jù)格式社區(qū)領(lǐng)域模型元素詞表DCMI抽象模型DCMI句法指南RDF/SRDF標(biāo)注 Annotate建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)運(yùn)用運(yùn)用建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)基礎(chǔ)標(biāo)準(zhǔn)領(lǐng)域標(biāo)準(zhǔn)DC應(yīng)用綱要新加坡框架圖示(來(lái)自
9、Tom Baker)描述集綱要(DSP)定義了描述集在結(jié)構(gòu)方面的約束:允許出現(xiàn)怎樣的描述允許采用怎樣的屬性怎樣的屬性值聚合方式以XML表達(dá)(RDF當(dāng)然是XML)忽略元素的定義(通過(guò)URI參考)忽略版本控制不要求應(yīng)用指南著錄規(guī)范等給人讀的文檔翻譯、修改自Mikael Nelsson的演講稿參見(jiàn):/architecturewiki/DescriptionSetProfile當(dāng)前元數(shù)據(jù)研究和應(yīng)用中的問(wèn)題 人讀而非機(jī)讀語(yǔ)義的模糊性模型的完整性(兩類(lèi)模型:FRBR和DCAM)執(zhí)行的一致性數(shù)據(jù)的獨(dú)立性基本上無(wú)法編碼實(shí)現(xiàn)包括數(shù)據(jù)庫(kù)系統(tǒng)開(kāi)發(fā))我們目前的元數(shù)據(jù)方案可以說(shuō)只完成了MAR
10、C數(shù)據(jù)格式的定義,還沒(méi)有2709格式使其真正機(jī)器可讀從這一點(diǎn)來(lái)說(shuō),目前各類(lèi)元數(shù)據(jù)著作、方案中值得推敲的地方還是比較多的一些建議建立本地化擴(kuò)展術(shù)語(yǔ)的命名域參考建立元數(shù)據(jù)應(yīng)用綱要(詞表)及編碼的登記注冊(cè)體系修訂目前的領(lǐng)域應(yīng)用元數(shù)據(jù)應(yīng)用綱要推進(jìn)元數(shù)據(jù)集成開(kāi)發(fā)系統(tǒng)(IDE)軟件和工具的開(kāi)發(fā)建立數(shù)字圖書(shū)館標(biāo)準(zhǔn)規(guī)范的開(kāi)放討論維護(hù)機(jī)制“機(jī)讀版元數(shù)據(jù)方案的推廣、培訓(xùn)隨著元數(shù)據(jù)應(yīng)用的開(kāi)展和普及,一致性問(wèn)題越來(lái)越嚴(yán)重?,F(xiàn)在如果不重視,將后患無(wú)窮!問(wèn)題討論元素名是否應(yīng)該翻譯?dc:creator“Verfasser”標(biāo)簽“Creator”標(biāo)簽“創(chuàng)建者”標(biāo)簽Server inGermanyServer in CASD
11、CMI Server(上圖改編自Stuart Weibel有關(guān)演示文稿) 元素名只是一個(gè)機(jī)器識(shí)別的符號(hào)(Token)而已 一個(gè)符號(hào)(token),多種翻譯(labels) 如果翻譯了,就不是DC了 (“盜版DC“?)元數(shù)據(jù)“記錄是怎樣的結(jié)構(gòu)?過(guò)去稱(chēng)為記錄的,多為現(xiàn)在所稱(chēng)的描述平面化(MARC中的記錄)“虛擬記錄”傳統(tǒng)結(jié)構(gòu):數(shù)據(jù)庫(kù)記錄-文件系統(tǒng)描畫(huà)/描述集1:1原則是針對(duì)描述而言,而非記錄描畫(huà)/描述集可以通過(guò)不同的記錄形式/格式來(lái)實(shí)現(xiàn)DCAM打散了資源描述,在具體應(yīng)用中如何實(shí)現(xiàn)?DCAM是一個(gè)抽象模型,不考慮具體實(shí)現(xiàn)如記錄的統(tǒng)一、聚類(lèi)等);DCAM提供需求分析、功能設(shè)計(jì)的思路和方法,應(yīng)用系統(tǒng)可以采用任何方式實(shí)現(xiàn)功能;目前URI是一切Web資源描述的基礎(chǔ),包括URL和URN兩類(lèi)。URN(eg:DOI/ISBN,甚至各類(lèi)詞表)如何實(shí)現(xiàn)全局解析,不是Web的事情,是行業(yè)應(yīng)用的事情;URI不是完美的資源標(biāo)識(shí)方法
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 景區(qū)旅游服務(wù)質(zhì)量提升工程考核試卷
- 寶石的稀有性與收藏價(jià)值分析考核試卷
- 生活初一上冊(cè)語(yǔ)文作文
- 筆的使用與維護(hù)培訓(xùn)考核試卷
- 河南省洛陽(yáng)市宜陽(yáng)縣2023-2024學(xué)年七年級(jí)下學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 紡織原料行業(yè)人才培養(yǎng)計(jì)劃考核試卷
- 未來(lái)的數(shù)字化戲劇與表演藝術(shù)創(chuàng)新方向考核試卷
- 漁業(yè)機(jī)械化捕撈作業(yè)效率與漁獲物處理考試考核試卷
- 纖維板生產(chǎn)設(shè)備維護(hù)與管理考核試卷
- 青浦高三語(yǔ)文二模作文
- 電梯的應(yīng)急預(yù)案培訓(xùn)
- 高中語(yǔ)文部編版教材單元寫(xiě)作任務(wù)(必修上下冊(cè)+選擇性必修上中下冊(cè))
- 2025年國(guó)際教育資源共享合同范本
- GB/T 45166-2024無(wú)損檢測(cè)紅外熱成像檢測(cè)總則
- 脫硝催化劑環(huán)境影響評(píng)估-洞察分析
- 2025年春新外研版(三起)英語(yǔ)三年級(jí)下冊(cè)課件 Unit4第1課時(shí)Startup
- 2025年異位妊娠診斷與治療策略研究綜述
- 2025年福建省龍巖市武平縣鄉(xiāng)村振興戰(zhàn)略?xún)?chǔ)備人才引進(jìn)18人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 人教版(2025新版)七年級(jí)下冊(cè)數(shù)學(xué)第七章 相交線與平行線 單元測(cè)試卷(含答案)
- 12J12無(wú)障礙設(shè)施圖集
- 【八年級(jí)下冊(cè)地理中圖北京版】期中真題必刷卷B-【期中真題必刷卷】(北京專(zhuān)用)(解析版)
評(píng)論
0/150
提交評(píng)論