數(shù)字圖書館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)
數(shù)字圖書館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第2頁(yè)
數(shù)字圖書館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第3頁(yè)
數(shù)字圖書館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第4頁(yè)
數(shù)字圖書館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)字圖書館自動(dòng)查重程序的設(shè)計(jì)與實(shí)現(xiàn)

在今天,我們重視數(shù)字圖書館的建設(shè),基于現(xiàn)有圖書館的管理系統(tǒng),開發(fā)和設(shè)計(jì)具有實(shí)際使用價(jià)值的計(jì)算機(jī)程序,減少圖書館服務(wù)人員的工作量是一個(gè)不容忽視的問(wèn)題。筆者于2001年領(lǐng)導(dǎo)開發(fā)了香港浸會(huì)大學(xué)圖書館計(jì)算機(jī)自動(dòng)查重程序,以全自動(dòng)的方式取代耗時(shí)費(fèi)力的傳統(tǒng)人工采訪查重及館藏評(píng)價(jià)的書目核對(duì)法(Listchecking),具有較強(qiáng)的實(shí)際應(yīng)用價(jià)值.自動(dòng)查重程序的設(shè)計(jì)主要是充分發(fā)揮Innopac圖書館管理系統(tǒng)的網(wǎng)上聯(lián)機(jī)公共檢索目錄(WebOnlinePublicAccessCatalog,OPAC)的檢索技術(shù)而成.本文主要對(duì)該程序的算法簡(jiǎn)要述評(píng),以供各同業(yè)先進(jìn)指正.1完成訪談和評(píng)審后,將參考過(guò)程與藏書評(píng)估進(jìn)行比較1.1訪談與培訓(xùn)圖書館在進(jìn)行采訪工作時(shí),為避免浪費(fèi)經(jīng)費(fèi)購(gòu)買不需要的復(fù)本,必須核查待選書目中的每一筆紀(jì)錄是否為館藏所有,這樣的工作程序被稱為采訪查重.1.2核心目數(shù)和館藏檢數(shù)所占比例.書目核對(duì)法是館藏評(píng)鑒常用方法之一,圖書館先選擇某一學(xué)科的核心或權(quán)威書目,將書目中每一項(xiàng)資料逐一與館藏檢記錄核查,計(jì)算該書目在館藏中所占比例.館藏中擁有比例越高,館藏素質(zhì)的評(píng)價(jià)就越高.1.3館藏查核工序雖然采訪查重與書目核對(duì)法的作用有所不同,但在對(duì)館藏檢查核對(duì)的工作程序上來(lái)說(shuō),兩者是完全一樣的.所以,為了方便討論起見,在下文的論述中將館藏查核工序,統(tǒng)一簡(jiǎn)稱為查重.1.4長(zhǎng)期重復(fù)單調(diào)工作長(zhǎng)久以來(lái),查重是一種勞力密集、千篇一律的重復(fù)性工作.工作雖然簡(jiǎn)單,但所耗費(fèi)的人力和時(shí)間卻不容忽視.而圖書館員在長(zhǎng)時(shí)間進(jìn)行重復(fù)單調(diào)的工作,亦會(huì)很容易產(chǎn)生漏檢和錯(cuò)檢的問(wèn)題.1.5計(jì)算機(jī)程序浸圖計(jì)算機(jī)自動(dòng)查重程序的設(shè)計(jì)目的,就是以計(jì)算機(jī)程序來(lái)取代傳統(tǒng)人工查重方式,它具有以下3個(gè)優(yōu)點(diǎn):減輕館員的勞動(dòng)強(qiáng)度;減低漏檢和錯(cuò)檢率;能在短時(shí)間內(nèi)完成大量查重工作.2自動(dòng)檢查程序的系統(tǒng)結(jié)構(gòu)和系統(tǒng)要求2.1系統(tǒng)結(jié)構(gòu)圖自動(dòng)查重程序的整個(gè)工作流程大致可分為四大部分,其結(jié)構(gòu)圖如圖1所示.2.2系統(tǒng)要求自動(dòng)查重程序由以下兩個(gè)程序組成:2.2.1tinumopac用MicrosoftVisualFoxPro6.0語(yǔ)言寫成,可在PentinumⅢ或以上的個(gè)人計(jì)算機(jī)上運(yùn)行.其功能包括:①把待檢書目的各檢索字段轉(zhuǎn)換成可向OPAC系統(tǒng)進(jìn)行查詢的URL;②把待檢書目由客戶終端機(jī)上載至服務(wù)器進(jìn)行自動(dòng)查重;③把查核記錄由服務(wù)器下載回客戶終端機(jī)上,以供館員分析統(tǒng)計(jì).2.2.2ssac軟件用MicrosoftActiveServerPages3.0(MSASP)語(yǔ)言寫成,在WindowsNT服務(wù)器上運(yùn)行.主要是把待檢書目對(duì)OPAC系統(tǒng)作自動(dòng)查重,并將查核結(jié)果登錄于待檢書目上.3自動(dòng)恢復(fù)過(guò)程和工作流的自動(dòng)控制3.1查詢數(shù)據(jù)的自動(dòng)查重程序主要受精密為免浪費(fèi)時(shí)間人力在OPAC系統(tǒng)上以人工鍵入書目查詢數(shù)據(jù),自動(dòng)查重程序只接受以MSExcel電子格式儲(chǔ)存的待檢書目,各項(xiàng)檢索字段(如作者、書名及ISBN等)必須儲(chǔ)存于列表的不同欄位中(見表1).3.2兩種方法的比較此部分程序主要是把待檢書目的各項(xiàng)檢索字段自動(dòng)鍵入OPAC系統(tǒng).浸圖是采用美國(guó)的Innopac圖書館自動(dòng)管理系統(tǒng),故自動(dòng)查重程序主要是因應(yīng)InnopacOPAC系統(tǒng)的檢索功能而設(shè)計(jì).但必須強(qiáng)調(diào)的是,自動(dòng)查重程序亦可應(yīng)用于其他以HTTPGet方法傳遞查詢數(shù)據(jù)的OPAC系統(tǒng)上.3.2.1HTTPGet數(shù)據(jù)傳遞方法根據(jù)萬(wàn)維網(wǎng)協(xié)定,傳遞查詢數(shù)據(jù)到HTTP服務(wù)器有HTTPGet和HTTPPost兩種不同的方法,它們分別是:(1)如果使用HTTPGet方法,查詢數(shù)據(jù)會(huì)被以一個(gè)統(tǒng)一資源地址(UniformResourceLocators,URL)中字符串的形式來(lái)傳遞.若使用HTTPPost方法,查詢數(shù)據(jù)便會(huì)以隱藏的數(shù)據(jù)區(qū)塊(Datablock)方式傳送到HTTP服務(wù)器.(2)在HTTPGet方法中,所傳遞的URL的字符串的總長(zhǎng)度不能超越255個(gè)英文字母,而HTTPPost方法則沒(méi)有此限制.HTTPGet方法雖然有字符串長(zhǎng)度的限制,但因?yàn)樗馨巡樵償?shù)據(jù)內(nèi)容公開列明于URL中,所以程序員便可自由開發(fā)程序生成URL連結(jié)來(lái)提取數(shù)據(jù)庫(kù)中的任何一條資料記錄.3.2.2InnopacOPAC的查詢指令I(lǐng)nnopacOPAC是使用HTTPGet方法把查詢數(shù)據(jù)傳遞給服務(wù)器,換言之,用來(lái)查詢的指令就是一條指向浸圖OPAC服務(wù)器的URL,其語(yǔ)法如下:http://[圖書館Innopac服務(wù)器網(wǎng)址]/search/[索引字符]?SEARCH=[檢索字段]其中,浸圖InnopacOPAC服務(wù)器網(wǎng)址為.hk/,而可使用的檢索點(diǎn)如表2所示.根據(jù)以上的指令模式,便可把在待檢書目中各檢索字段用程序自動(dòng)轉(zhuǎn)換為向OPAC查詢的URL,如表3所示.3.3查詢結(jié)果的獲取當(dāng)上述的URL被逐一導(dǎo)向浸圖InnopacOPAC系統(tǒng)后,OPAC系統(tǒng)會(huì)依據(jù)查詢數(shù)據(jù)在Innopac數(shù)據(jù)庫(kù)中找尋相應(yīng)的記錄,無(wú)論命中與否,皆會(huì)將搜尋結(jié)果的館藏記錄網(wǎng)頁(yè)傳回給客戶終端機(jī)上的瀏覽器.3.3.1自動(dòng)查重記錄若查核的檢索字段并非為館藏所有,InnopacOPAC系統(tǒng)在傳回的館藏記錄網(wǎng)頁(yè)上會(huì)出現(xiàn)“Nomatchesfound(意即[未查獲符合查詢條件館藏])”的提示語(yǔ)句(見圖2),亦即是“無(wú)命中”的意思,自動(dòng)查重程序便自動(dòng)把該檢索字段的查重記錄列為顯示藏館記錄網(wǎng)頁(yè)若查核的檢索字段為館藏,InnopacOPAC系統(tǒng)便會(huì)顯示藏館記錄網(wǎng)頁(yè),而在該網(wǎng)頁(yè)中亦不會(huì)出現(xiàn)“Nomatchesfound”的提示語(yǔ)句,這是“命中”的意思,查重程序便自動(dòng)把該檢索字段的查重記錄列為1.3.4自動(dòng)查重程序.根據(jù)檢查進(jìn)展的要求,將書目的查重記錄的各檢點(diǎn)的查重記錄通過(guò)數(shù)字結(jié)合的方式查重比自動(dòng)查重程序是可以清楚標(biāo)示各檢索點(diǎn)的查重記錄,但在處理一些少數(shù)有問(wèn)題或疑難的查重記錄時(shí),還是需要人工判斷.為了方便館員作分析統(tǒng)計(jì)及在有需要時(shí)進(jìn)行人工復(fù)檢,自動(dòng)查重程序會(huì)將書目的查核結(jié)果儲(chǔ)存在一個(gè)MSExcel電子格式文件檔內(nèi),內(nèi)容除了包括表1代檢書目中各項(xiàng)資料外,還會(huì)列出了各檢索點(diǎn)的查重記錄.表4便是針對(duì)表1對(duì)各條查重記錄的分析報(bào)告.3.4.1記錄1各項(xiàng)檢索點(diǎn)的查重記錄均為1,表示該項(xiàng)資料為復(fù)本.3.4.2用漢字文書進(jìn)行資料查重ISBN查重記錄為1,其余各項(xiàng)檢索點(diǎn)的查重記錄均為0.導(dǎo)致此類查重結(jié)果可能出于多個(gè)不同的原因,在此例子中,待檢書目是外文書,而作者的姓名及書名都是中文譯名,但在浸圖的編目記錄中,外文作者均采用英文原名,故此作者的查重記錄便顯示為0.假設(shè)ISBN查重記錄被視為最值得信賴的,那么,只要ISBN查重記錄為1時(shí),館員便不須理會(huì)其余各項(xiàng)檢索點(diǎn)的查重記錄,而可以直接把該條資料判定為復(fù)本.3.4.3圖書館的《內(nèi)部文本》見表1ISBN查重記錄為0,其余各項(xiàng)檢索點(diǎn)的查重記錄均為1.這表示圖書館已擁有余秋雨的《千年一嘆》一書(見記錄1),但該書并不是在這條記錄中列出的北京作家出版社所出版,故此,被查核資料可被判定為非館藏所有.3.4.4記錄4各項(xiàng)檢索點(diǎn)的查重記錄均為0,該項(xiàng)資料可被判定為非館藏所有.3.4.5共藏/本企業(yè)的作者相關(guān)資料ISBN及作者+書名的查重記錄為0,而作者和書名的查重記錄均為1.這表示圖書館擁有該作者的其它作品,并且館藏中也可找到書名相同而作者不同的資料,但被查核的作者和書名并沒(méi)有在任何一條館藏記錄中同時(shí)出現(xiàn),因此,被查核資料可被判定為非館藏.3.4.6被查核資料可被判定為復(fù)本除了作者的查重記錄為1外,其余各項(xiàng)檢索點(diǎn)的查重記錄均為0.這表示圖書館擁有該作者的其它作品,而被查核資料可被判定為非館藏.簡(jiǎn)單來(lái)說(shuō),若以ISBN查重記錄為關(guān)鍵值,那只要ISBN查重記錄為1,如第1、2條記錄便可直接被判定為復(fù)本;反之,ISBN查重記錄為0,如第3~6條記錄則可被判定為非館藏所有.4最具創(chuàng)意大賽自動(dòng)查重程序查核1000項(xiàng)檢索點(diǎn)大約需時(shí)5min,浸圖自2001年使用該程序以來(lái),查重的工作效率大大提升.自動(dòng)查重程序的設(shè)計(jì),原先是浸圖系統(tǒng)部為采購(gòu)部開發(fā)網(wǎng)上新書訂購(gòu)服務(wù)程序的一個(gè)有機(jī)組成部份.浸圖以網(wǎng)上新書訂購(gòu)服務(wù)程序榮獲Innopac系統(tǒng)的第一屆“最具創(chuàng)意獎(jiǎng)項(xiàng)”(FirstBeInnovativeAwards)比賽中的“最具創(chuàng)意館員模塊獎(jiǎng)項(xiàng)”(MostInnovativeUseofStaffModules).該獎(jiǎng)項(xiàng)已于2002年4月在美國(guó)德克薩斯州休斯敦市舉行的第10屆InnovativeUsers

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論