數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用_第1頁
數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用_第2頁
數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用_第3頁
數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用_第4頁
數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用摘要闡述了數(shù)據(jù)挖掘技術(shù)的概念,提出了數(shù)據(jù)挖掘技術(shù)在高校圖書館中應(yīng)用的必要性,并對數(shù)據(jù)挖掘在高校圖書館四個方面的應(yīng)用進行了分析,旨在為高校圖書館個性化信息服務(wù)拋磚引玉。 關(guān)鍵詞數(shù)據(jù)挖掘;高校圖書館 1數(shù)據(jù)挖掘技術(shù) 11數(shù)據(jù)挖掘技術(shù)概念 隨著科技日新月異的發(fā)展,信息加工和處理也成為信息化的主要技術(shù)支撐,目前,許多領(lǐng)域的問題都是通過數(shù)據(jù)挖掘來解決的,數(shù)據(jù)挖技術(shù)在人們?nèi)粘I钪袘?yīng)用也越來越廣泛。數(shù)據(jù)挖掘技術(shù)幫助人們對各個領(lǐng)域的信息處理。數(shù)據(jù)挖掘是什么?目前,人們對信息需求遠遠大于過去任何一個時代,傳統(tǒng)的統(tǒng)計工具無法滿足現(xiàn)階段人們的需求,數(shù)據(jù)挖掘技術(shù)也隨著數(shù)字化、信息化的飛

2、速發(fā)展應(yīng)運而生。數(shù)據(jù)挖掘就是根據(jù)已有的不清晰、雜亂無章的海量信息,提取出所需信息的過程。通過數(shù)據(jù)挖掘,大量無規(guī)范的數(shù)據(jù)通過統(tǒng)計進行數(shù)據(jù)分類管理,從而將數(shù)據(jù)的規(guī)律和數(shù)據(jù)模式挖掘出來,并對未來數(shù)據(jù)的走向進行有效分析和預(yù)測。數(shù)據(jù)挖掘技術(shù)與很多學(xué)科領(lǐng)域相互交叉應(yīng)用,涉及的知識面比較廣泛,相比傳統(tǒng)的信息處理方法,從表面上沒有任何相互關(guān)聯(lián)的數(shù)據(jù)中,挖掘出事情的關(guān)聯(lián)原因,找出事物發(fā)展的規(guī)律,并用數(shù)據(jù)作為支撐,為決策者提供切實可靠的參考。 12數(shù)據(jù)挖掘類型 按照數(shù)據(jù)結(jié)構(gòu)的方式來劃分,通常可以分為文本數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘和數(shù)值數(shù)據(jù)挖掘。 1.2.1文本數(shù)據(jù)挖掘 文本數(shù)據(jù)挖掘,顧名思義就是從文本數(shù)據(jù)中通過計算

3、機處理技術(shù)挖掘出有效、有價值的信息。文本信息挖掘主要包含兩類,一是文本信息;二是文檔類信息挖掘。數(shù)據(jù)挖掘的對象均為文本信息數(shù)據(jù)。文本信息挖掘方法主要有:文本分類、文本聚類、信息抽取、摘要及壓縮。挖掘文本數(shù)據(jù),主要包含對文本信息特征提取與文本信息分類、分析文本數(shù)據(jù)等。在對文本數(shù)據(jù)挖掘進行應(yīng)用時,主要是以詞串表示法、貝葉斯分類算法、詞集合算法等技術(shù)手段為輔助,以便于完成信息數(shù)據(jù)相關(guān)工作。 1.2.2Web數(shù)據(jù)挖掘 Web數(shù)據(jù)挖掘,從字面上來解讀,是挖掘技術(shù)在Web頁面上的應(yīng)用。包括針對Web數(shù)據(jù)等信息,如Web頁面結(jié)構(gòu)、用戶信息等等信息數(shù)據(jù),進行提取、優(yōu)化頁面設(shè)置,掌握訪問用戶的內(nèi)容和行為。為用戶

4、提供更多優(yōu)質(zhì)服務(wù),根據(jù)服務(wù)目的和內(nèi)容的差異,對不同個體進行差異性的挖掘,具體包括挖掘Web日志、內(nèi)容和結(jié)構(gòu)。 1.2.3數(shù)值數(shù)據(jù)挖掘 數(shù)值數(shù)據(jù)挖掘,從字面上來看,主要是對數(shù)值數(shù)據(jù)的挖掘。主要的任務(wù)有描述數(shù)值數(shù)據(jù)和預(yù)測數(shù)值數(shù)據(jù)兩種。數(shù)值數(shù)據(jù)挖掘功能為概念描述,重點進行分類分析和預(yù)測分析。常見的方法,有歸納法、模糊數(shù)學(xué)方法、遺傳算法等。 2數(shù)據(jù)挖掘技術(shù)在高校圖書館建設(shè)中的必要性 21館藏建設(shè)的需要 圖書館作為高校科研和知識的前沿陣地,它不僅擁有濃郁的書香文化氛圍,豐富的館藏資源也是必不可少的。現(xiàn)代圖書館,不光需要滿足讀者用戶翻閱紙質(zhì)書籍的需求,也需要滿足數(shù)字資源的需求?,F(xiàn)代科技和互聯(lián)網(wǎng)的發(fā)展,改變

5、了人們的閱讀模式,便利、快捷的碎片化閱讀成為人們首選的閱讀方式。數(shù)字化閱讀越來越受廣大讀者用戶喜愛,人們可以通過搜索引擎迅速查閱到所需圖書的相關(guān)信息,具有時效性和便捷性。計算機應(yīng)用技術(shù)的發(fā)展在數(shù)據(jù)挖掘技術(shù)領(lǐng)域,結(jié)合圖書館原有的館藏資源,分析館藏已有資源,將紙質(zhì)書籍做可視化處理,挖掘出信息數(shù)據(jù)中館藏建設(shè)的優(yōu)勢和劣勢,良好結(jié)合圖書館現(xiàn)有館藏情況進行分析,將分析結(jié)果進行評估,這對豐富館藏建設(shè)有著建設(shè)性意義。高校圖書館館藏必須滿足科研和學(xué)科需要,學(xué)生用戶處于積累知識階段,所需要的信息資源也是各種各樣,對讀者信息的挖掘,能夠有效有針對性的節(jié)省開支,館藏內(nèi)容都通過數(shù)據(jù)挖掘技術(shù)來推算和評估,以供指導(dǎo)未來采購

6、書籍和學(xué)科建設(shè)。 22滿足用戶多樣化需求 高校圖書館的用戶類型,主要是教師讀者和學(xué)生讀者。讀者用戶的不同,需要提供的信息也大不相同。這就要求圖書館對讀者多樣化需求進行數(shù)據(jù)挖掘,并根據(jù)讀者用戶的個性化需求來推送信息。首先,根據(jù)已知基本讀者信息,得出不同讀者的個性化需求。其次,分析不同讀者信息需求和獲取信息的多樣化途徑。最后,根據(jù)已有信息內(nèi)容和信息獲取方式,進行數(shù)據(jù)挖掘分析對比,從而實現(xiàn)因人而異的服務(wù)方式,提升圖書館信息服務(wù)質(zhì)量。根據(jù)讀者信息和訪問等數(shù)據(jù)挖掘,可以反映出讀者用戶的需求,從而更好地服務(wù)讀者。 23符合圖書館未來發(fā)展 現(xiàn)代高校圖書館的重要競爭力是數(shù)字圖書館,這一點符合“互聯(lián)網(wǎng)圖書館”的

7、發(fā)展。高校圖書館的應(yīng)用信息系統(tǒng)擁有大量數(shù)字資源,并通過網(wǎng)絡(luò)技術(shù)等資源進行組織和整合,滿足用戶的需求。只有將大量數(shù)據(jù)資源和互聯(lián)網(wǎng)關(guān)聯(lián)信息進行有效的數(shù)據(jù)挖掘,才能挖掘出其中的最大價值,數(shù)據(jù)挖掘技術(shù)在圖書館信息化發(fā)展和信息服務(wù)建設(shè)方面有著無可替代的優(yōu)勢。 3數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用 31數(shù)據(jù)挖掘技術(shù)在文獻推薦中的應(yīng)用 文獻利用率是考核高校圖書館服務(wù)質(zhì)量的一項重要的指標(biāo),如何為讀者用戶提供可參考有價值的圖書文獻,做好文獻推薦工作是高校圖書館個性化服務(wù)的重要組成部分。數(shù)據(jù)挖掘技術(shù)在圖書館借閱率中的應(yīng)用,主要是根據(jù)讀者用戶進出圖書館的數(shù)據(jù)與借閱、瀏覽圖書數(shù)據(jù)、進行分類分析與關(guān)聯(lián)分析。通過數(shù)據(jù)分析,

8、得出讀者用戶所借閱的數(shù)據(jù)與相關(guān)類別圖書,呈現(xiàn)出一定的關(guān)聯(lián)性,根據(jù)其中的規(guī)律,可以用于后臺熱點推薦和個性化推送。如讀者在借閱卡耐基的人性的優(yōu)點時候,又借閱了相關(guān)心理學(xué)書籍,說明這個讀者喜歡書籍類型,具有一定關(guān)聯(lián),那么適當(dāng)推薦心理學(xué)相關(guān)書籍、勵志書籍給該讀者,可以幫助讀者節(jié)約查閱書籍的時間,提高對圖書館的利用率。 32可視化信息服務(wù) 數(shù)據(jù)挖掘技術(shù)比傳統(tǒng)數(shù)據(jù)統(tǒng)計和表格更加清晰地體現(xiàn)出直觀效果。人工智能技術(shù)和可視化設(shè)備大量引進圖書館后,圖書館不僅僅可以將讀者借閱數(shù)據(jù)、館藏數(shù)據(jù)、個性化偏好等數(shù)據(jù),用直觀可視化的圖表清晰表現(xiàn)出來。還為圖書館建設(shè)提供一些參考。通過收集數(shù)據(jù)數(shù)據(jù)挖掘數(shù)據(jù)評價,將圖書館各項數(shù)據(jù)指

9、標(biāo),實時記錄高校圖書館各個部門人員圖書借閱情況、到館情況、讀者密集度和習(xí)慣,用圖表方式展現(xiàn)出來,為圖書館管理者提供服務(wù)和管理重要依據(jù)。 33閱讀推廣服務(wù) 高校圖書館閱讀推廣服務(wù),為保證廣大讀者用戶更加充分利用圖書館資源,激發(fā)讀者興趣,推廣校園讀書文化有重要意義。數(shù)據(jù)挖掘技術(shù)結(jié)合圖書館閱讀推廣活動,首先對讀者用戶的瀏覽圖書館界面和借閱記錄進行數(shù)據(jù)采集,根據(jù)讀者偏好,結(jié)合圖書館現(xiàn)有館藏資源,篩選讀者用戶可能感興趣的內(nèi)容,并通過網(wǎng)絡(luò)手段推送給讀者用戶;其次,根據(jù)搜索數(shù)據(jù)進行統(tǒng)計,如將熱門關(guān)鍵詞與館藏資源進行數(shù)據(jù)信息匹配,以評價最好、熱度最大等排列組合推薦給讀者,如熱門當(dāng)紅讀者、出版社、話題最熱等內(nèi)容

10、。再次,根據(jù)深度挖掘信息數(shù)據(jù),找到相關(guān)規(guī)律,如世界讀書日等熱門節(jié)日,以這些為指標(biāo)為讀者推廣工作提供一些依據(jù)。 34學(xué)科信息服務(wù) 高校圖書館的資源具有豐富的學(xué)術(shù)性特點,數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館,為學(xué)院發(fā)展、學(xué)科建設(shè)和服務(wù)提供了特色化服務(wù)。高校圖書館應(yīng)主動結(jié)合用戶的實際需求和專業(yè)特色,進行信息服務(wù)。如根據(jù)熱點專業(yè)、精品課程、課堂研究等已有的內(nèi)容,進行深度挖掘,使其具有更高價值,為讀者用戶提供的前沿研究領(lǐng)域和熱點動態(tài)。如建筑行業(yè)高校圖書館,重點關(guān)注建筑設(shè)計、建筑工程、建筑設(shè)備、橋梁等相關(guān)領(lǐng)域前沿研究信息和動態(tài),通過熱點和館內(nèi)資源進行深度數(shù)據(jù)挖掘,為讀者用戶從海量數(shù)據(jù)中挑選出隱含的知識信息,為研究提供正確方向,實現(xiàn)學(xué)科信息服務(wù)功能。 4展望 數(shù)據(jù)挖掘技術(shù)在高校圖書館中除了在文中提到的文獻推薦、可視化信息、學(xué)科信息服務(wù)、閱讀推廣工作中應(yīng)用,在其他圖書館管理工作和建設(shè)中也應(yīng)用得相當(dāng)廣泛。在圖書館

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論