版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 基于二分網(wǎng)絡(luò)的檔案小眾推薦服務(wù)模型研究 吳晨菁摘 要:文章將二分網(wǎng)絡(luò)運用到檔案部門服務(wù)工作中,根據(jù)檔案利用者的類型、需求特征和檔案信息特點建立檔案小眾化推薦服務(wù)模型,通過物質(zhì)擴(kuò)散和熱傳導(dǎo)推薦算法的加權(quán)融合計算利用者與檔案信息之間的網(wǎng)絡(luò)關(guān)系,生成具有針對性的推薦列表,以期為檔案部門向利用者提供縱深服務(wù)提供參考。關(guān)鍵詞:檔案少用性;二分網(wǎng)絡(luò);推薦服務(wù)模型;小眾服務(wù)當(dāng)前,我國檔案利用熱情逐漸冷卻,依據(jù)二分網(wǎng)絡(luò)建立的小眾推薦服務(wù)模型就是一種針對檔案少用性提供縱深推薦的服務(wù)方式。近年來,依托計算機(jī)而高度發(fā)達(dá)的數(shù)據(jù)存儲及運算,使復(fù)雜網(wǎng)絡(luò)的構(gòu)建得以實現(xiàn)。
2、復(fù)雜網(wǎng)絡(luò)的研究主要集中于自然科學(xué)、工程科學(xué)領(lǐng)域,在圖書館領(lǐng)域的研究也逐漸增多,在檔案領(lǐng)域僅有一篇涉及檔案學(xué)術(shù)語的探討,二分網(wǎng)絡(luò)在檔案領(lǐng)域的研究為零。因此,筆者研究二分網(wǎng)絡(luò)相關(guān)內(nèi)容,對其在小眾推薦服務(wù)的應(yīng)用進(jìn)行初探。1 檔案小眾推薦服務(wù)模型構(gòu)建的依據(jù)1.1 實踐依據(jù)。檔案的現(xiàn)實少用性是檔案小眾推薦服務(wù)模型建立的實踐依據(jù)。我國檔案利用活動經(jīng)歷過三次高峰期:平反冤假錯案、上山下鄉(xiāng)工齡檔案查詢、編史修志工作。1此后,類似的利用高峰再未出現(xiàn)?,F(xiàn)階段,一方面,檔案的原始記錄性、機(jī)密性、區(qū)域性及價值轉(zhuǎn)移致使其無法時常處于高利用狀態(tài);2 另一方面,大部分的檔案利用需求來自工作查考、學(xué)術(shù)研究,檔案利用需求表現(xiàn)出
3、明顯的階段性針對性。歷史上,雖然檔案已從封建統(tǒng)治的高閣走向人民身邊,然而民眾的檔案意識尚未完全覺醒。但我們說檔案的少用性現(xiàn)實狀態(tài),并不是指不利用。檔案部門開展基于二分網(wǎng)絡(luò)的小眾推薦服務(wù),針對特定用戶分不同群組開展服務(wù),是追求縱深服務(wù)的方式。31.2 理論依據(jù)。二分網(wǎng)絡(luò)是檔案小眾推薦服務(wù)模型建立的理論依據(jù),通過二部分圖可以探測到利用者之間、利用者與檔案之間的互動關(guān)系,社團(tuán)結(jié)構(gòu)是有針對性的服務(wù)模式。1.2.1 二分網(wǎng)絡(luò)概述。二分網(wǎng)絡(luò)用于挖掘主體與客體的關(guān)系,是符合利用者利用需求長尾現(xiàn)象的網(wǎng)絡(luò)形式。4二部分圖是其表現(xiàn)形式,它由兩方面組合,利用者及檔案構(gòu)成頂點集v,利用者和檔案的鏈接構(gòu)成邊集e,表達(dá)式
4、為g=(v,e),如圖1(a)。v包含利用者子集u和檔案子集a,基于圖1建立的連接,可以得出集合u和集合a的單模映射,如圖1(b)、圖1(c)。二部分圖及單模映射可以反映出利用行為的集聚特點及小眾化特征。1.2.2 二分網(wǎng)絡(luò)的特性。度與度分布度。一個節(jié)點的度是指與該節(jié)點相連接的另一部分節(jié)點的數(shù)量,在圖1(a)中,u8節(jié)點僅與a5相連接,因此u8的度為1,如圖1(b)所示。度分布是某選定節(jié)點與另一子集中節(jié)點連接的數(shù)目的分布情況。5度分布反映了最為活躍的利用者群體,以及被利用最為頻繁的檔案。集聚系數(shù)。同一卷宗中每份檔案之間有很強(qiáng)的關(guān)聯(lián)性,這就形成了無形的網(wǎng)絡(luò)鏈接結(jié)構(gòu),卷宗中某一份檔案也會在年份、人
5、物等上與其他卷宗產(chǎn)生聯(lián)系,這樣的聚集鏈接就反映了該二分網(wǎng)絡(luò)的聚集程度,即集聚系數(shù),表示二分網(wǎng)絡(luò)結(jié)構(gòu)中各部分的聯(lián)系程度。社團(tuán)結(jié)構(gòu)。利用者多為因某個原因而聚集在一起的一類群體,檔案也會集聚,這些群體就是二分網(wǎng)絡(luò)中的社團(tuán)結(jié)構(gòu)。其形成以網(wǎng)絡(luò)中的節(jié)點為基礎(chǔ),首先設(shè)定相似度,然后合并相似度最高的社團(tuán),形成新的社團(tuán)結(jié)構(gòu),接著以新的社團(tuán)結(jié)構(gòu)為基礎(chǔ),設(shè)定新的相似度,重復(fù)合并重復(fù)計算,最后組成一個大社團(tuán)。62 檔案小眾推薦服務(wù)模型的建立結(jié)合二分網(wǎng)絡(luò)和檔案利用者小眾群組的相關(guān)內(nèi)容,構(gòu)建了如圖2所示的檔案小眾推薦服務(wù)模型。2.1 利用者群組。根據(jù)檔案的少用特性,檔案的主要利用者多以專業(yè)、興趣等聚集,他們就是二分網(wǎng)絡(luò)中
6、的社團(tuán)結(jié)構(gòu),在社團(tuán)結(jié)構(gòu)中形成了利用者與利用者之間的聚類關(guān)系、利用者與檔案之間的小眾偏好關(guān)系。分析群組中利用者之間的影響方式、影響程度,挖掘隱藏關(guān)系,完善利用者群組之間的網(wǎng)絡(luò)結(jié)構(gòu)。72.2 二分網(wǎng)絡(luò)。建立利用者集合與檔案信息集合是利用者與檔案資源二分網(wǎng)絡(luò)形成的基礎(chǔ)。分析利用者建立利用者模型,根據(jù)檔案語義建立檔案資源模型,結(jié)合檔案資源主題詞、關(guān)鍵詞進(jìn)行利用者與檔案之間的信息過濾,析出利用者之間的概率偏好關(guān)系,建立利用者與檔案資源二部分結(jié)構(gòu)。然后根據(jù)二部分圖中利用者與檔案之間連接關(guān)系,給利用者賦予初始值。2.3 推薦算法的加權(quán)。2.3.1 推薦算法。二部分圖中,利用者與檔案都將視為單純的節(jié)點納入推薦
7、算法中,以利用與被利用的選擇關(guān)系為依托,預(yù)測利用者對尚未接觸過檔案的喜好程度。物質(zhì)擴(kuò)散和熱傳導(dǎo)是主流的推薦算法。物質(zhì)擴(kuò)散滿足守恒定律,節(jié)點a會把能量平均傳遞給相連的u節(jié)點,每個u節(jié)點的能量是從所有a中獲得能量的總和。如圖1,給u1相連的節(jié)點賦予能量1,不相連的為0,則u1的最終能量值為1/3的a1加1/2的a2。u會把收集到的能量再平均返回給a,算法如上。最后,將能量值最大的未利用過的檔案推薦給該利用者。熱傳導(dǎo)算法中每個u節(jié)點的能量是相連的a節(jié)點能量的平均值,如u1的能量值為(1+1)/2;能量返回子集a后,a的能量就為相連的所有u節(jié)點能量的平均值。由此,便會推薦某利用者尚未使用過的檔案信息中
8、能量最高者。物質(zhì)擴(kuò)散算法最后結(jié)果傾向于推薦熱門的檔案信息;熱傳導(dǎo)算法在能量傳遞中,熱源存在,冷門檔案資源也不會被忽略。物質(zhì)擴(kuò)散和熱傳導(dǎo)推薦算法相結(jié)合,涵蓋更全面的檔案信息,這對檔案利用者主力軍提供更深入的推薦服務(wù)很有必要。82.3.2 加權(quán)融合。物質(zhì)擴(kuò)散偏向于呈現(xiàn)給利用者熱點性的檔案信息,而熱傳導(dǎo)偏向于不易被發(fā)現(xiàn)的檔案信息,更加注重多樣性,兩種算法各有其側(cè)重的方面。設(shè)定一個動態(tài)的可調(diào)權(quán)重,通過檔案利用者對推薦服務(wù)評價的變化,建立加權(quán)模型,調(diào)節(jié)物質(zhì)擴(kuò)散和熱傳導(dǎo)推薦算法的比例,達(dá)到兩者有效的結(jié)合。對兩種算法的加權(quán)融合同時滿足了利用者對熱門資源與冷門資源的多樣需求,最大限度地將館藏檔案資源納入到小眾
9、化推薦服務(wù)中去,使推薦服務(wù)更加全面深入。3 檔案小眾推薦服務(wù)模型的實現(xiàn)3.1 理念支撐。社會全體尤其是檔案部門要正確認(rèn)識目前我國檔案利用不高的現(xiàn)象,這是推薦模型實現(xiàn)的理念支撐。無論理論上、實踐上,還是歷史的角度,都造就了目前我國檔案少用性的現(xiàn)狀。利用者與檔案二分網(wǎng)絡(luò)結(jié)構(gòu)可以平衡熱門與冷門資源的度,理性認(rèn)識檔案的少用特性,才能理性地開展推薦服務(wù)工作。3.2 資源保障。3.2.1 利用者調(diào)研。利用者群組(社團(tuán))是在一定的興趣、專業(yè)、行業(yè)等范圍內(nèi)形成的,對群組的分析基于客觀、全面的基礎(chǔ)上。所以,形成利用者社團(tuán)首先要對利用者進(jìn)行充分的調(diào)研。利用者調(diào)研不必追求廣而泛,側(cè)重于精而深的縱向數(shù)據(jù)收集及數(shù)據(jù)分析
10、。3.2.2 檔案信息整合。檔案信息集合是二分網(wǎng)絡(luò)中的另一個數(shù)據(jù)集合,館藏檔案的收集、整理、存儲是數(shù)據(jù)挖掘與分析的前提。提供縱深服務(wù)需要海量的檔案信息支撐,檔案信息的有效整合是二分網(wǎng)絡(luò)中算法實現(xiàn)的基礎(chǔ)。檔案信息的整合注重寬而廣的特點,收集、存儲會應(yīng)用到一些技術(shù)手段,特別是云存儲技術(shù)。3.3 技術(shù)支持。在進(jìn)行利用者、檔案信息相互之間的數(shù)據(jù)分析時,需要運用數(shù)據(jù)挖掘技術(shù)來挖掘出不易被發(fā)現(xiàn)的關(guān)系,通過建模技術(shù)建立模型。因此,靈活使用數(shù)據(jù)挖掘工具、掌握先進(jìn)建模技術(shù),將會對推薦結(jié)果的準(zhǔn)確性、推薦服務(wù)的可靠性大有裨益。4 結(jié)語檔案的少用性質(zhì)決定了當(dāng)前我國檔案部門不會像圖書館那樣門庭若市,檔案利用者也因職業(yè)、學(xué)術(shù)研究、興趣愛好等利用需求而形成小眾的利用者群組。因此,針對有需求的檔案利用者群組,檔案部門可以運用二分網(wǎng)絡(luò)的相關(guān)內(nèi)容,建立檔案利用者與檔案信息之間的二分結(jié)構(gòu),深度挖掘利用者之間、利用者與檔案信息之間復(fù)雜的聯(lián)系,進(jìn)而將工作重點從由如何擴(kuò)大服務(wù)數(shù)量切實轉(zhuǎn)移到如何提高檔案部門服務(wù)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024離婚雙方的共同債權(quán)債務(wù)處理合同
- 2024苗木種植與園林苗木種植基地規(guī)劃與建設(shè)勞務(wù)分包協(xié)議3篇
- 2024版活動場地使用合同范本
- 2025年度生態(tài)農(nóng)業(yè)園承包合同格式規(guī)范4篇
- 2024鎳礦國際貿(mào)易法律事務(wù)咨詢服務(wù)合同3篇
- 2025年度新能源車輛代理記賬與補(bǔ)貼申請合同4篇
- 2025年度文化產(chǎn)業(yè)發(fā)展總經(jīng)理聘用協(xié)議3篇
- 《蒸汽鍋爐維護(hù)與管理》課件
- 2025年度個人二手房交易反擔(dān)保合同規(guī)范4篇
- 2025年度博物館展覽館日常保潔與文物保護(hù)合同4篇
- GB/T 31888-2015中小學(xué)生校服
- 質(zhì)量檢查考核辦法
- 不動產(chǎn)登記實務(wù)培訓(xùn)教程課件
- 不銹鋼制作合同范本(3篇)
- 云南省普通初中學(xué)生成長記錄-基本素質(zhì)發(fā)展初一-初三
- 2023年系統(tǒng)性硬化病診斷及診療指南
- 外科醫(yī)師手術(shù)技能評分標(biāo)準(zhǔn)
- 《英語教師職業(yè)技能訓(xùn)練簡明教程》全冊配套優(yōu)質(zhì)教學(xué)課件
- 采購控制程序
- 六年級上冊數(shù)學(xué)簡便計算題200題專項練習(xí)
- 冀教版八年級上冊Unit 1 單詞短語句型復(fù)習(xí)預(yù)習(xí)單
評論
0/150
提交評論