



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
摘
要:文章針對(duì)當(dāng)前公共圖書館少兒閱讀推薦服務(wù)中存在的問題,研究了基于大數(shù)據(jù)挖掘的公共圖書館少兒閱讀推薦方法,通過對(duì)比實(shí)驗(yàn)的方式證明了該方法的優(yōu)越性,即對(duì)于少兒和少兒家長偏好度的提升效果更好,且能在滿足少兒閱讀需求的基礎(chǔ)上引導(dǎo)少兒養(yǎng)成良好的閱讀習(xí)慣。關(guān)鍵詞:大數(shù)據(jù)挖掘;公共圖書館;少兒閱讀;推薦方法中圖分類號(hào):G258.2
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1003-1588(2024)01-0013-03公共圖書館是開展閱讀推廣的重要機(jī)構(gòu),承擔(dān)著培養(yǎng)少兒閱讀習(xí)慣,提升其閱讀能力的重要責(zé)任。在多元化時(shí)代背景下,少兒的閱讀環(huán)境發(fā)生了翻天覆地的變化,閱讀資源豐富,少兒的閱讀需求越來越多元化、個(gè)性化[1]。與成年人相比,少兒的閱讀能力和理解能力較弱[2],難以閱讀理論性較強(qiáng)或?qū)哟屋^深的圖書。因此,公共圖書館在為少兒讀者推薦閱讀資源的過程中,應(yīng)積極利用大數(shù)據(jù)、云計(jì)算等現(xiàn)代化技術(shù)手段尋找適合其閱讀的資源[3]。大數(shù)據(jù)技術(shù)中的大數(shù)據(jù)挖掘是指利用特定算法深度挖掘隱藏信息,常被應(yīng)用于計(jì)算機(jī)、醫(yī)學(xué)、經(jīng)濟(jì)等領(lǐng)域,成效顯著,但在公共圖書館領(lǐng)域的研究和應(yīng)用案例較少。1
基于大數(shù)據(jù)挖掘的公共圖書館少兒閱讀推薦方法1.1
公共圖書館少兒閱讀資源的獲取與處理為了保障少兒閱讀推薦服務(wù)的質(zhì)量,公共圖書館需確保相關(guān)閱讀資源的數(shù)量和質(zhì)量。在開展少兒閱讀資源建設(shè)的過程中,公共圖書館需要對(duì)各類信息資源進(jìn)行清查、轉(zhuǎn)化、集成等處理,為后續(xù)開展數(shù)據(jù)信息的挖掘工作提供優(yōu)質(zhì)信息源,這些信息包括館藏圖書數(shù)據(jù)、讀者信息、圖書借閱數(shù)據(jù)等[4]。其中,館藏圖書數(shù)據(jù)是公共圖書館在日常運(yùn)行過程中必不可少的數(shù)據(jù)信息,圖書數(shù)據(jù)包括書名、作者等一系列圖書屬性信息;讀者信息是少兒閱讀推薦方法必須用到的關(guān)鍵數(shù)據(jù),包括讀者個(gè)人信息、讀者借閱情況聚類分析數(shù)據(jù)等[5];圖書借閱數(shù)據(jù)是取自公共圖書館借閱業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)信息,是研究少兒讀者閱讀行為的關(guān)鍵信息。公共圖書館在獲取少兒閱讀資源后,應(yīng)對(duì)這些資源進(jìn)行相應(yīng)的預(yù)處理,處理流程如圖1所示。需要注意的是,公共圖書館應(yīng)對(duì)相關(guān)數(shù)據(jù)進(jìn)行空值數(shù)據(jù)處置和噪音數(shù)據(jù)過濾等處理,為每一本圖書設(shè)定獨(dú)立的索引,并對(duì)讀者信息中的空白項(xiàng)(空值)進(jìn)行補(bǔ)全處理[6]。在該過程中,如果存在無法補(bǔ)全的問題,公共圖書館就需要清除相關(guān)數(shù)據(jù)信息,并及時(shí)清除數(shù)據(jù)源中的重復(fù)數(shù)據(jù),以提高大數(shù)據(jù)挖掘效率。在完成數(shù)據(jù)清洗后,公共圖書館應(yīng)將各類數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式[7],并進(jìn)行數(shù)據(jù)集成,生成少兒基礎(chǔ)數(shù)據(jù)表、少兒節(jié)約數(shù)據(jù)表及少兒圖書數(shù)據(jù)表,為大數(shù)據(jù)挖掘奠定數(shù)據(jù)資源基礎(chǔ)。1.2
基于大數(shù)據(jù)挖掘的少兒讀者信息挖掘公共圖書館應(yīng)對(duì)少兒讀者的信息進(jìn)行聚類處理與分析,合理劃分少兒閱讀群體,科學(xué)選取符合不同少兒閱讀群體閱讀要求的閱讀資源開展少兒閱讀推薦服務(wù)。公共圖書館可按以下步驟挖掘少兒讀者信息。第一步,設(shè)置聚類個(gè)數(shù),對(duì)已完成處理的數(shù)據(jù)源進(jìn)行聚類解析,以隨機(jī)的方式獲取少兒讀者閱讀信息,利用K-means算法對(duì)數(shù)據(jù)表中的數(shù)據(jù)進(jìn)行聚類和挖掘處理。王鳳燕結(jié)合公共圖書館的讀者借閱數(shù)據(jù)將少兒讀者分為活躍型、普通型及其他類型3類[8],因此筆者將聚類K值設(shè)定為3。在分類過程中,筆者引入歐氏距離計(jì)算公式,計(jì)算不同少兒讀者信息與所屬分類之間的歐式距離,計(jì)算公式為:d(x1,x2)=∑di=1(x1k-x2k)2其中,d(x1,x2)為兩個(gè)陳述屬性x1和x2之間的歐氏距離,x1k和x2k為兩個(gè)陳述屬性的詳細(xì)選值。公共圖書館根據(jù)該公式計(jì)算得出歐氏距離后,可基于聚類相關(guān)結(jié)構(gòu),重新設(shè)定k個(gè)簇,利用誤差平方等對(duì)聚類特性進(jìn)行評(píng)定。假設(shè)在某一數(shù)據(jù)集中,k個(gè)簇的子集分別為各個(gè)簇的樣本數(shù)據(jù),則其誤差平方和的計(jì)算公式為:E=∑ki=1‖p-m‖2其中,E為誤差平方和,p為簇的個(gè)數(shù),m為各簇樣本數(shù)目。將數(shù)據(jù)集中的所有元素按照新的中心重新完成聚類,若匯總計(jì)算得出的誤差平方和不再發(fā)生明顯變化,則說明已完成聚類和收斂。第二步,在完成對(duì)準(zhǔn)則函數(shù)是否收斂的判斷后,將各類少兒讀者信息進(jìn)行分類存儲(chǔ),并通過可視化的方式進(jìn)行展示。第三步,將少兒讀者聚類挖掘的行為有效值設(shè)定為k,在此過程中,應(yīng)知悉k的有效取值范圍會(huì)直接影響對(duì)少兒讀者信息聚類的效果。如果k的最終選值較小,則會(huì)在聚類后出現(xiàn)簇族覆蓋范圍過大的問題,甚至?xí)霈F(xiàn)聚類結(jié)果價(jià)值性信息較少的問題;如果k的最終選值較大,則會(huì)在聚類后出現(xiàn)簇族覆蓋范圍過小的問題,導(dǎo)致聚類數(shù)據(jù)分散,無法得到關(guān)聯(lián)性較強(qiáng)的數(shù)值。通常情況下,在初步完成對(duì)k的賦值后,必須通過持續(xù)調(diào)節(jié)的方式對(duì)k的值進(jìn)行優(yōu)化,得到一個(gè)簇間距較小的有效區(qū)間,在該區(qū)間內(nèi)輸出合適的k值。1.3
基于大數(shù)據(jù)挖掘的少兒借閱信息挖掘在完成對(duì)少兒讀者信息的挖掘后,公共圖書館應(yīng)利用大數(shù)據(jù)技術(shù)進(jìn)一步挖掘少兒借閱信息,研究少兒讀者的潛在閱讀行為規(guī)律,并通過設(shè)置支持度有效閾值、借閱行為信度等方式,對(duì)不同圖書的價(jià)值與關(guān)聯(lián)度進(jìn)行分析,具體的信息挖掘步驟如下。第一步,利用公共圖書館歷史數(shù)據(jù)庫中的信息資源建設(shè)少兒借閱信息數(shù)據(jù)庫。在數(shù)據(jù)庫建設(shè)過程中,公共圖書館可將部分圖書借閱記錄作為項(xiàng)數(shù)集合,以分析數(shù)據(jù)庫中信息的關(guān)聯(lián)性。第二步,定義少兒借閱信息行為的支持度S,行為有效置信度C及行為提升潛在空間lift,將這3個(gè)參數(shù)作為變量參數(shù),并進(jìn)行關(guān)聯(lián)處理,得到少兒借閱信息挖掘的關(guān)聯(lián)規(guī)則。公共圖書館通過調(diào)整參數(shù)有效范圍的方式,可實(shí)現(xiàn)對(duì)挖掘信息中關(guān)聯(lián)值的干擾,并通過迭代的方式,對(duì)關(guān)聯(lián)規(guī)則進(jìn)行優(yōu)化。在確認(rèn)各參數(shù)之間具有強(qiáng)關(guān)聯(lián)性后,公共圖書館應(yīng)對(duì)lift參數(shù)進(jìn)行調(diào)整,僅保留大于lift值的數(shù)據(jù),并將其作為關(guān)聯(lián)規(guī)則數(shù)值,并對(duì)相關(guān)信息進(jìn)行強(qiáng)關(guān)聯(lián)處理,以深入挖掘少兒借閱信息。第三步,在完成對(duì)信息的處理后,通過設(shè)置項(xiàng)集的方式,對(duì)關(guān)聯(lián)信息進(jìn)行集中展示,由終端技術(shù)人員負(fù)責(zé)對(duì)數(shù)據(jù)信息進(jìn)行篩查,手動(dòng)清除無關(guān)信息,優(yōu)化信息挖掘成果。1.4
公共圖書館少兒閱讀個(gè)性化推薦在完成信息挖掘的基礎(chǔ)上,公共圖書館可有效開展少兒閱讀個(gè)性化推薦服務(wù),在為少兒讀者推薦優(yōu)質(zhì)閱讀資源的同時(shí),快速檢索并聚類相似度較高的讀者信息群。公共圖書館可收集少兒讀者的個(gè)人及檢索數(shù)據(jù),利用大數(shù)據(jù)挖掘結(jié)果構(gòu)建關(guān)聯(lián)模型,精準(zhǔn)地為少兒讀者推薦閱讀資源。2
對(duì)比實(shí)驗(yàn)為了驗(yàn)證基于大數(shù)據(jù)挖掘的少兒閱讀推薦方法的效果,筆者分別將該方法與基于信息覓食的少兒閱讀推薦方法應(yīng)用于某公共圖書館的相關(guān)實(shí)踐,對(duì)兩種方法的用戶偏好度進(jìn)行對(duì)比,用戶偏好度計(jì)算公式為:U={(a1,b1),(a2,b2),…,(a3,b3)}其中,U為少兒閱讀推薦結(jié)果中的用戶偏好度,ai為某一類公共圖書館閱讀資源的評(píng)價(jià)數(shù)據(jù),bi為某一類閱讀推薦方法的用戶評(píng)價(jià)指數(shù),i的取值范圍均為1,2,3,……,n。根據(jù)實(shí)際情況,筆者將U的取值范圍設(shè)定為0到1之間,U的值越接近1,說明推薦的圖書越能夠滿足少兒讀者的閱讀需求。由于少兒的認(rèn)知發(fā)育不夠健全,因此,公共圖書館在計(jì)算用戶偏好度的過程中,除考慮少兒讀者的閱讀需求外,還應(yīng)考慮少兒家長的教育需求。表1為筆者針對(duì)兩種少兒閱讀推薦方法的用戶偏好度計(jì)算結(jié)果,基于大數(shù)據(jù)挖掘的少兒閱讀推薦方法的用戶偏好度明顯高于基于信息覓食的少兒閱讀推薦方法。3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DB31/ 834-2014中空玻璃單位產(chǎn)品能源消耗限額
- DB31/ 267-2015燃料含硫量和灰分限值
- 2025裝修項(xiàng)目經(jīng)理合同示范文本
- 2024年健康運(yùn)動(dòng)信息測(cè)量產(chǎn)品資金申請(qǐng)報(bào)告代可行性研究報(bào)告
- 水土保持項(xiàng)目環(huán)境保護(hù)與可持續(xù)發(fā)展合同
- 繼承房產(chǎn)質(zhì)量問題處理與質(zhì)量保障協(xié)議
- 網(wǎng)紅級(jí)面包店品牌加盟授權(quán)及綠色供應(yīng)鏈合作協(xié)議
- 2025年中國保鮮豆腐行業(yè)市場(chǎng)規(guī)模調(diào)研及投資前景研究分析報(bào)告
- 電影電視劇主題歌全球獨(dú)家發(fā)行合同
- 抖音平臺(tái)達(dá)人解約賠償協(xié)議及商業(yè)權(quán)益分配細(xì)則
- 消防安全主題班會(huì)課件(共17張ppt)
- 《全球通史》課件
- 北師版六年級(jí)解方程練習(xí)200題
- 外貿(mào)鎖檢測(cè)報(bào)告樣式EN12209
- 無損檢測(cè)人員登記表
- DB33-T 2048-2017(2021)民宿基本要求與評(píng)價(jià)
- 1員工培訓(xùn)記錄表表格類
- 某大學(xué)論文答辯模板課件
- 50以內(nèi)加減法練習(xí)題打印版(100題)
- 基礎(chǔ)體溫表格基礎(chǔ)體溫表
- 煤炭項(xiàng)目建議書【范文參考】
評(píng)論
0/150
提交評(píng)論