發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢(shì)研究_第1頁(yè)
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢(shì)研究_第2頁(yè)
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢(shì)研究_第3頁(yè)
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢(shì)研究_第4頁(yè)
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢(shì)研究_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

發(fā)現(xiàn)系統(tǒng)的應(yīng)用及發(fā)展趨勢(shì)研究目錄

背景概述

123發(fā)現(xiàn)系統(tǒng)的應(yīng)用

發(fā)現(xiàn)系統(tǒng)的發(fā)展趨勢(shì)1.背景概述隨著信息數(shù)量的急劇膨脹,如何有效利用大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)逐漸成為以圖書館為代表的信息服務(wù)機(jī)構(gòu)的當(dāng)務(wù)之急。圖書館、信息中心、數(shù)據(jù)公司等作為一個(gè)面向大眾的知識(shí)服務(wù)機(jī)構(gòu),不僅需要了解用戶需要什么服務(wù),更需要通過信息的產(chǎn)—供—消的聯(lián)動(dòng)關(guān)系去挖掘正在發(fā)生什么、預(yù)測(cè)和分析將來會(huì)發(fā)生什么。知識(shí)發(fā)現(xiàn)(Knowledge-DiscoveryinDatabases,簡(jiǎn)稱KDD):從大量數(shù)據(jù)中提取出可信的、有效的、新穎的以及最終可理解的模式的高級(jí)處理過程?!壳爸R(shí)發(fā)現(xiàn)比較公認(rèn)的概念是由Fayyad等人提出來的。1.背景概述KDD在研究和應(yīng)用方面發(fā)展迅速,尤其是在商業(yè)和銀行領(lǐng)域的應(yīng)用比研究的發(fā)展速度更快KDD在學(xué)術(shù)界和工業(yè)界的影響越來越大,國(guó)際KDD組委會(huì)把專題討論會(huì)更名為國(guó)際會(huì)議知識(shí)發(fā)現(xiàn)的概念最早源于知識(shí)工程和人工智能(AI)領(lǐng)域在加拿大蒙特利爾召開了第一屆KDD國(guó)際學(xué)術(shù)會(huì)議,以后每年召開一次1989年首次出現(xiàn)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)的概念2015年現(xiàn)在KDD技術(shù)在商業(yè)應(yīng)用中已經(jīng)可以馬上投入使用2.發(fā)現(xiàn)系統(tǒng)的應(yīng)用發(fā)現(xiàn)系統(tǒng)2.1發(fā)現(xiàn)系統(tǒng)簡(jiǎn)介2.3發(fā)現(xiàn)系統(tǒng)可用性評(píng)估2.2中外文發(fā)現(xiàn)系統(tǒng)2.1發(fā)現(xiàn)系統(tǒng)簡(jiǎn)介背景:依托圖書館等信息機(jī)構(gòu)的服務(wù)系統(tǒng)、海量數(shù)字資源及各類信息的邏輯關(guān)系等,創(chuàng)建服務(wù)于信息用戶的新一代知識(shí)發(fā)現(xiàn)系統(tǒng)已成為大數(shù)據(jù)時(shí)代信息服務(wù)機(jī)構(gòu)的必然選擇。定義:發(fā)現(xiàn)系統(tǒng):通過一個(gè)簡(jiǎn)單的檢索接口,對(duì)預(yù)先索引好的元數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行檢索,并返回統(tǒng)一檢索結(jié)果的一類檢索服務(wù)系統(tǒng)。——NFAIS CodeofPracticeDraft:DiscoveryServices

[EB/OL],(2012-01-30).[2013-07-04].

發(fā)現(xiàn)系統(tǒng)原理圖

發(fā)現(xiàn)系統(tǒng)解決了什么問題

用戶:眾多的數(shù)據(jù)庫(kù)給用戶帶來困惑——資源發(fā)現(xiàn)冗余、超載信息的數(shù)據(jù)關(guān)聯(lián)與情報(bào)分析——知識(shí)發(fā)現(xiàn)館藏資源得到了有效利用資源發(fā)現(xiàn)(淺發(fā)現(xiàn))→知識(shí)發(fā)現(xiàn)(深發(fā)現(xiàn))2.2中外文發(fā)現(xiàn)系統(tǒng)國(guó)外四大資源發(fā)現(xiàn)系統(tǒng)1、Proquest旗下SerialsSolution公司在2009年7月推出了第一款網(wǎng)絡(luò)級(jí)發(fā)現(xiàn)系統(tǒng)Summon。2、2009年7月,ExLibris公司公開了PrimoCentral元數(shù)據(jù)倉(cāng)儲(chǔ)的建設(shè)進(jìn)展情況,其統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)Primo測(cè)試版也于2010年1月發(fā)布,同時(shí)將原有的Primo架構(gòu)集成到PrimoCentral和館藏目錄系統(tǒng)之上。3、OCLC于2007年11月推出全球第一款WorldcatLocal系統(tǒng),提供館藏資源和電子資源的一站式檢索,隨著OCLC與數(shù)據(jù)庫(kù)商的不斷合作,WorldcatLocal集成了元搜索功能,并于2010年開始提供網(wǎng)絡(luò)級(jí)發(fā)現(xiàn)服務(wù)。4、EBSCO公司也發(fā)布了發(fā)現(xiàn)系統(tǒng),名稱為EBSCODiscoveryService(簡(jiǎn)稱EDS)。

國(guó)外4大發(fā)現(xiàn)系統(tǒng)資源比較

系統(tǒng)元數(shù)據(jù)總量及資源范圍中文資源覆蓋SummonSummon涵蓋了7000多個(gè)出版商,80多種資源類型,包含了大約7.5億條數(shù)據(jù)記錄,其中39個(gè)開放獲取檔案和257個(gè)機(jī)構(gòu)資源庫(kù)中的4000萬(wàn)條記錄多半都是全文索引。與Calis達(dá)成協(xié)議,允許其利用其學(xué)術(shù)論文的元數(shù)據(jù);與Apabi達(dá)成相關(guān)數(shù)據(jù)使用協(xié)議PrimoCentralPrimoCentral已經(jīng)收錄超過5億條索引記錄,整合了世界上大部分的外文電子期刊文章、電子書元數(shù)據(jù)、部分報(bào)紙。已與重慶維普公司達(dá)成相關(guān)數(shù)據(jù)使用協(xié)議EDS截至2012年6月,EDS涵蓋了大約2萬(wàn)個(gè)期刊出版社和大約7萬(wàn)個(gè)圖書出版社,包括大約64000種期刊,82.5萬(wàn)CD&DVD,600萬(wàn)種圖書,3.2億報(bào)紙文章,40萬(wàn)會(huì)議記錄,還有幾十萬(wàn)種其它類型的信息資源。與Apabi達(dá)成協(xié)議,Apabi大量的電子書元,數(shù)據(jù)可以被EDS利用WCL截至2012年9月1日,WCL.可一站式搜索超過9.69億數(shù)據(jù)記錄,其中期刊91495篇,文章7.31億篇,數(shù)字內(nèi)容資料3200萬(wàn)部,電子圖書1390萬(wàn)冊(cè),機(jī)構(gòu)資料庫(kù)記錄2200萬(wàn)冊(cè),碩博士論文1800萬(wàn)冊(cè)?!獌?nèi)容國(guó)內(nèi)資源發(fā)現(xiàn)系統(tǒng)我國(guó)發(fā)現(xiàn)系統(tǒng)研究和應(yīng)用雖然起步較晚,但是國(guó)內(nèi)的很多高校圖書館已經(jīng)陸續(xù)開展針對(duì)自身實(shí)際的資源探索發(fā)現(xiàn)系統(tǒng)建設(shè)和應(yīng)用實(shí)踐。也有部分知名高校部分釆用直接引進(jìn)國(guó)外成熟的發(fā)現(xiàn)系統(tǒng)的方式來進(jìn)行建設(shè)。國(guó)內(nèi)相關(guān)的檢索系統(tǒng)提供商中,主要的服務(wù)商也開始提供發(fā)現(xiàn)系統(tǒng)或發(fā)現(xiàn)平臺(tái)的服務(wù)。2.3發(fā)現(xiàn)系統(tǒng)可用性評(píng)估發(fā)現(xiàn)系統(tǒng)的評(píng)估主體:發(fā)現(xiàn)系統(tǒng)的評(píng)價(jià)主體是指在資源發(fā)現(xiàn)系統(tǒng)考察試用、引進(jìn)和使用等各階段發(fā)揮領(lǐng)導(dǎo)、組織和實(shí)施作用的組織和個(gè)人。發(fā)現(xiàn)系統(tǒng)一般由圖書館直接購(gòu)買和引進(jìn),因此圖書館和讀者是發(fā)現(xiàn)系統(tǒng)的評(píng)價(jià)主體。發(fā)現(xiàn)系統(tǒng)的評(píng)估內(nèi)容:發(fā)現(xiàn)系統(tǒng)的評(píng)價(jià)內(nèi)容主要圍繞發(fā)現(xiàn)系統(tǒng)這一評(píng)價(jià)對(duì)象展開。(發(fā)現(xiàn)系統(tǒng)的功能評(píng)價(jià)、系統(tǒng)提供商的服務(wù)、用戶的使用評(píng)價(jià)、系統(tǒng)的使用量和使用效益)檢索功能和用戶界面產(chǎn)品功能評(píng)估評(píng)估點(diǎn)

界面體系設(shè)計(jì)結(jié)果保存/導(dǎo)出默認(rèn)檢索界面高級(jí)檢索界面分面檢索檢索結(jié)果顯示、排序獲?。ㄩ_放鏈接等)

檢索功能檢索速度檢索精度(糾錯(cuò)、人名識(shí)別、自然語(yǔ)言檢索等)檢索深度(摘要、全文索引等)檢索相關(guān)度(算法)檢索結(jié)果去重歸組讀者服務(wù)個(gè)性化設(shè)置個(gè)人賬戶資源推送

Web2.0服務(wù)(評(píng)論、分享等)讀者評(píng)估評(píng)估點(diǎn)讀者測(cè)試評(píng)估檢索的測(cè)評(píng)結(jié)果第一輪測(cè)評(píng)第二輪測(cè)評(píng)元數(shù)據(jù)評(píng)估評(píng)估點(diǎn)元數(shù)據(jù)數(shù)量和覆蓋率元數(shù)據(jù)數(shù)量對(duì)我館紙質(zhì)資源的覆蓋對(duì)我館電子資源的覆蓋元數(shù)據(jù)質(zhì)量元數(shù)據(jù)質(zhì)量和厚度(規(guī)范性、豐富性)元數(shù)據(jù)來源元數(shù)據(jù)來源資源更新頻率資源整合產(chǎn)品功能評(píng)估評(píng)估點(diǎn)與其它系統(tǒng)/資源的整合與支持與本館鏈接類產(chǎn)品配合度與本館OPAC系統(tǒng)的融合度文獻(xiàn)元數(shù)據(jù)導(dǎo)出接口電子期刊與紙本期刊資源的整合與WOS、Scopus的集成與CrossRefDOI的合作對(duì)館藏資源的整合(數(shù)據(jù)導(dǎo)入格式、數(shù)據(jù)上傳方式)對(duì)鏈接服務(wù)器的支持對(duì)移動(dòng)平臺(tái)的支持市場(chǎng)情況收費(fèi)與服務(wù)模式市場(chǎng)占有情況、發(fā)展態(tài)勢(shì)對(duì)中文和中國(guó)市場(chǎng)的支持程度后續(xù)系統(tǒng)可擴(kuò)展性與可維護(hù)性評(píng)估點(diǎn)運(yùn)營(yíng)維護(hù)運(yùn)營(yíng)維護(hù)方便程度運(yùn)維人力成本低運(yùn)維物力及財(cái)力成本低可擴(kuò)展性靈活性——系統(tǒng)可定制程度應(yīng)用接口及接口協(xié)議發(fā)現(xiàn)系統(tǒng)評(píng)價(jià)指標(biāo)體系發(fā)現(xiàn)系統(tǒng)可用性評(píng)估作用發(fā)現(xiàn)系統(tǒng)可用性評(píng)估有助于圖書館選擇合適的發(fā)現(xiàn)系統(tǒng),可以有力地支持圖書館與系統(tǒng)提供商的談判。促使系統(tǒng)提供商不斷完善發(fā)現(xiàn)系統(tǒng)產(chǎn)品,滿足用戶豐富和多樣化的信息獲取需求?,F(xiàn)在系統(tǒng)提供商-般都提供發(fā)現(xiàn)系統(tǒng)試用服務(wù),在試用階段圖書館和用戶可以根據(jù)已制定的評(píng)價(jià)指標(biāo)對(duì)資源發(fā)現(xiàn)系統(tǒng)進(jìn)行充分的測(cè)試、使用和評(píng)估,以保證評(píng)價(jià)結(jié)果的客觀性和最后決策的科學(xué)性。3.發(fā)現(xiàn)系統(tǒng)的發(fā)展趨勢(shì)更廣的資源覆蓋范圍更高的應(yīng)用程度更髙的占有率功能會(huì)日益發(fā)展Earlyresourcediscoverysystemfocusedontechnology,andnowtheresourcediscoverysystemarerequiredpayattentiontoconsideringdevelopingresourcesandimprovingtheusers’experienceasthemaintask.Breeding認(rèn)為早期資源發(fā)現(xiàn)系統(tǒng)專注于技術(shù),而現(xiàn)在的資源發(fā)現(xiàn)系統(tǒng)則需要轉(zhuǎn)移注意力,把發(fā)展資源內(nèi)容和增強(qiáng)用戶體驗(yàn)作為主要任務(wù)?!狹arshallB.Nextgenerationlibraryautomationanditsimplicationsforresourcesharing[EB/OL].[2011-03-20]

給予不同格式的資源被公平獲取的權(quán)利

在以后的發(fā)展中要更加注重對(duì)多媒體資源的集成

更深層次的內(nèi)容索引

用戶在搜索時(shí),文獻(xiàn)中的每個(gè)詞或詞組都有可能成為檢索,而不僅僅是關(guān)鍵詞、題目、作者等幾個(gè)有限的檢索點(diǎn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論