版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、元數(shù)據(jù)抽象模型與新加坡框架劉煒上海圖書館 2019數(shù)字圖書館建設(shè)與應(yīng)用研討會數(shù)字圖書館建設(shè)與應(yīng)用研討會*深圳深圳 主要內(nèi)容DC元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系DC元數(shù)據(jù)抽象模型DC元數(shù)據(jù)新加坡框架:應(yīng)用綱要的規(guī)范形式闡明:Google圖片搜索對此slide亦有貢獻(xiàn)DC元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系Element | DCMES, DCQElement |DCAMDCAP (DCTerms+) DC1.0 DC2.0DC1.0Elements元素Qualifiers修飾詞Element Refinements元素修飾詞(子元素)Encoding Schemes編碼體系修飾詞Vocabulary Encoding Sche
2、mes詞表編碼體系Syntax Encoding Schemes語法編碼體系 參見:/usage/documents/principles/#elementDC應(yīng)用綱要1.0CWA14855定義指南性文檔沒有對于元數(shù)據(jù)編碼的任何規(guī)定不支持DCAM不支持Description Set (描述集)DC眼中的世界(DCAM)任何事物都是資源資源有類型任何資源都可以以URI標(biāo)識任何資源都有屬性屬性詞即元數(shù)據(jù)屬性詞表即元數(shù)據(jù)方案元數(shù)據(jù)方案可有多種形式:不/半/規(guī)范的應(yīng)用綱要是一種正在成型的半/規(guī)范形式任何屬性都有屬性值屬性值有領(lǐng)域和范圍(domain & range)
3、屬性值可以是另一個(gè)資源,可以是文字(literal)取值的規(guī)范控制,即各類KOS,也是元數(shù)據(jù)DCMI類型詞表(DCTYPE)DC元數(shù)據(jù)描述的資源對象可能存在的類型:CollectionDatasetEventImageMovingImageStillImageInteractiveResourcePhysicalObjectServiceSoftwareText“資源的唯一必備屬性:URIURI:Uniform Resource Identifier (RFC3986定義)唯一必備功能:標(biāo)識資源(無論是物理的還是抽象的);包含三部分: 訪問資源的命名機(jī)制存放資源的主機(jī)名資源自身的名稱,由路徑表
4、示兩種類型:URL 如:/rfc/rfc3986.txt mailto:java-netjava.sunnews:comp.lang.java URN 如:urn:isbn:096139210 xurn:doi:10.1045/november2019-kaufmanURI是抽象類,并不規(guī)定解析進(jìn)一步說明元數(shù)據(jù)是一種人工語言消除歧義、明確定義、人機(jī)共讀);元數(shù)據(jù)元素集是描述資源各個(gè)方面的屬性詞表;元數(shù)據(jù)取值如果規(guī)定只能從某些詞表中選取,這些詞表就屬于受控的規(guī)范詞表;這屬于元素取值的domain和range;元數(shù)據(jù)應(yīng)用綱要是為了領(lǐng)域應(yīng)用而制訂的元數(shù)據(jù)方案的一種表達(dá)形式,目前正在成
5、為規(guī)范的,叫做“DC元數(shù)據(jù)應(yīng)用綱要”,核心是符合DC抽象模型的元數(shù)據(jù)形式化表述也就是一種機(jī)讀形式),通??梢砸訰DF形式表達(dá);應(yīng)用模型規(guī)定應(yīng)用領(lǐng)域的各類實(shí)體及其相互關(guān)系)、著錄規(guī)則等文檔,也可以成為元數(shù)據(jù)應(yīng)用綱要的組成部分;元數(shù)據(jù)注冊系統(tǒng)可以作為元數(shù)據(jù)元素的命名域管理體系而存在,但命名域并非一定需要注冊系統(tǒng)進(jìn)行管理;元數(shù)據(jù)元素詞表,包括規(guī)定元數(shù)據(jù)取值的規(guī)范詞表,都可以看成是一種人工語言,每個(gè)術(shù)語都應(yīng)該被賦予唯一的URI,都可以通過注冊系統(tǒng)進(jìn)行管理;元數(shù)據(jù)形式化的表達(dá)必須采用基于XML的RDF或OWL等的Schema,著錄工作單當(dāng)然可以通過完整表達(dá)元數(shù)據(jù)方案各種關(guān)系和約束的schema來自動(dòng)生成
6、,并進(jìn)行校驗(yàn)。當(dāng)然這需要一定的環(huán)境和軟件工具來實(shí)現(xiàn) Resource haspropertyDC:CreatorDC:TitleDC:SubjectDC:Date.X主語謂詞屬性詞屬性值optional qualifieroptional qualifier修飾/限定詞來自(from):Stuart WeibelResource hasDate2000-06-13RevisedISO8601Resource hasSubjectLanguages - GrammarLCSH來自(from):Stuart WeibelDC屬性元素的“領(lǐng)域和范圍(Domain and Range)”見:dubli
7、/documents/domain-range/index.shtmlRecord (encoded as html, XML, or RDF/XMLDescription setResource Description (URI)Resource Description (URI)Resource Description (URI)Statement Statement Statement language (pt-BR)DCAM圖示(來自Andy Powell)value stringvalue URIproperty (URI)syntax encodingscheme
8、Vocabulary encoding scheme新加坡框架進(jìn)一步定義了DC應(yīng)用綱要符合DC抽象模型(DCAM)的應(yīng)用綱要 (“DC應(yīng)用綱要”) 包含如下一系列文檔:功能需求說明(必須desirable)領(lǐng)域模型 (應(yīng)有mandatory)元素集描述 (DSP) (應(yīng)有mandatory)應(yīng)用指南 (可選)編碼句法指南(可選)應(yīng)用指南功能需求領(lǐng)域模型元素集描畫編碼指南與數(shù)據(jù)格式社區(qū)領(lǐng)域模型元素詞表DCMI抽象模型DCMI句法指南RDF/SRDF標(biāo)注 Annotate建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)運(yùn)用運(yùn)用建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)建立基礎(chǔ)基礎(chǔ)標(biāo)準(zhǔn)領(lǐng)域標(biāo)準(zhǔn)DC應(yīng)用綱要新加坡框架圖示(來自
9、Tom Baker)描述集綱要(DSP)定義了描述集在結(jié)構(gòu)方面的約束:允許出現(xiàn)怎樣的描述允許采用怎樣的屬性怎樣的屬性值聚合方式以XML表達(dá)(RDF當(dāng)然是XML)忽略元素的定義(通過URI參考)忽略版本控制不要求應(yīng)用指南著錄規(guī)范等給人讀的文檔翻譯、修改自Mikael Nelsson的演講稿參見:/architecturewiki/DescriptionSetProfile當(dāng)前元數(shù)據(jù)研究和應(yīng)用中的問題 人讀而非機(jī)讀語義的模糊性模型的完整性(兩類模型:FRBR和DCAM)執(zhí)行的一致性數(shù)據(jù)的獨(dú)立性基本上無法編碼實(shí)現(xiàn)包括數(shù)據(jù)庫系統(tǒng)開發(fā))我們目前的元數(shù)據(jù)方案可以說只完成了MAR
10、C數(shù)據(jù)格式的定義,還沒有2709格式使其真正機(jī)器可讀從這一點(diǎn)來說,目前各類元數(shù)據(jù)著作、方案中值得推敲的地方還是比較多的一些建議建立本地化擴(kuò)展術(shù)語的命名域參考建立元數(shù)據(jù)應(yīng)用綱要(詞表)及編碼的登記注冊體系修訂目前的領(lǐng)域應(yīng)用元數(shù)據(jù)應(yīng)用綱要推進(jìn)元數(shù)據(jù)集成開發(fā)系統(tǒng)(IDE)軟件和工具的開發(fā)建立數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范的開放討論維護(hù)機(jī)制“機(jī)讀版元數(shù)據(jù)方案的推廣、培訓(xùn)隨著元數(shù)據(jù)應(yīng)用的開展和普及,一致性問題越來越嚴(yán)重?,F(xiàn)在如果不重視,將后患無窮!問題討論元素名是否應(yīng)該翻譯?dc:creator“Verfasser”標(biāo)簽“Creator”標(biāo)簽“創(chuàng)建者”標(biāo)簽Server inGermanyServer in CASD
11、CMI Server(上圖改編自Stuart Weibel有關(guān)演示文稿) 元素名只是一個(gè)機(jī)器識別的符號(Token)而已 一個(gè)符號(token),多種翻譯(labels) 如果翻譯了,就不是DC了 (“盜版DC“?)元數(shù)據(jù)“記錄是怎樣的結(jié)構(gòu)?過去稱為記錄的,多為現(xiàn)在所稱的描述平面化(MARC中的記錄)“虛擬記錄”傳統(tǒng)結(jié)構(gòu):數(shù)據(jù)庫記錄-文件系統(tǒng)描畫/描述集1:1原則是針對描述而言,而非記錄描畫/描述集可以通過不同的記錄形式/格式來實(shí)現(xiàn)DCAM打散了資源描述,在具體應(yīng)用中如何實(shí)現(xiàn)?DCAM是一個(gè)抽象模型,不考慮具體實(shí)現(xiàn)如記錄的統(tǒng)一、聚類等);DCAM提供需求分析、功能設(shè)計(jì)的思路和方法,應(yīng)用系統(tǒng)可以采用任何方式實(shí)現(xiàn)功能;目前URI是一切Web資源描述的基礎(chǔ),包括URL和URN兩類。URN(eg:DOI/ISBN,甚至各類詞表)如何實(shí)現(xiàn)全局解析,不是Web的事情,是行業(yè)應(yīng)用的事情;URI不是完美的資源標(biāo)識方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東科貿(mào)職業(yè)學(xué)院《科學(xué)中醫(yī)筋膜學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東江門中醫(yī)藥職業(yè)學(xué)院《森林生態(tài)學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東技術(shù)師范大學(xué)《環(huán)境信息系統(tǒng)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東環(huán)境保護(hù)工程職業(yè)學(xué)院《生物信息分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工商職業(yè)技術(shù)大學(xué)《工業(yè)生物過程導(dǎo)論》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東第二師范學(xué)院《求職訓(xùn)練》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東財(cái)貿(mào)職業(yè)學(xué)院《舞蹈身體語》2023-2024學(xué)年第一學(xué)期期末試卷
- 小班結(jié)核病安全教育課件
- 光纖通信概論教學(xué)課件
- 廣東碧桂園職業(yè)學(xué)院《基坑工程》2023-2024學(xué)年第一學(xué)期期末試卷
- 當(dāng)食物成為撫慰:善待自己重塑大腦告別情緒性進(jìn)食
- 機(jī)電運(yùn)輸安全基本知識
- XX藥業(yè)公司受試者日記卡
- 連鎖藥店GSP質(zhì)量管理體系詳細(xì)文件
- 水上交通行業(yè)安全培訓(xùn)
- 《電氣工程講》課件
- 甘肅省蘭州市城關(guān)區(qū)2022-2023學(xué)年三年級上學(xué)期期末數(shù)學(xué)試卷
- 全域土地綜合整治規(guī)劃方案
- GB/T 26940-2023牡蠣干
- 計(jì)算機(jī)網(wǎng)絡(luò)安全第9章VPN
- ERAS標(biāo)準(zhǔn)病房評審標(biāo)準(zhǔn)表
評論
0/150
提交評論