促進(jìn)數(shù)據(jù)、信息和知識(shí)融通_第1頁
促進(jìn)數(shù)據(jù)、信息和知識(shí)融通_第2頁
促進(jìn)數(shù)據(jù)、信息和知識(shí)融通_第3頁
促進(jìn)數(shù)據(jù)、信息和知識(shí)融通_第4頁
促進(jìn)數(shù)據(jù)、信息和知識(shí)融通_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

促進(jìn)數(shù)據(jù)、信息和知識(shí)融通PromotingtheIntegrationofData,InformationandKnowledge:LiteratureReviewontheJCDL2020呂思妤/吳丹作者簡(jiǎn)介:呂思妤,ORCID:0000-0001-7189-0512,武漢大學(xué)信息管理學(xué)院碩士研究生,武漢大學(xué)人機(jī)交互與用戶行為研究中心,研究方向:數(shù)據(jù)科學(xué)、深度學(xué)習(xí),E-mail:lsy240597@163;吳丹,通訊作者,0RCID:0000-0002-2611-7317,博士,武漢大學(xué)信息管理學(xué)院教授,武漢大學(xué)人機(jī)交互與用戶行為研究中心,研究方向:信息檢索,用戶信息行為,人機(jī)交互,E-mail:woodan@o武漢430072原發(fā)信息:《圖書情報(bào)知識(shí)》(武漢)2021年第20212期第110-120頁內(nèi)容提要:[目的/意義]通過對(duì)2020年國(guó)際數(shù)字圖書館聯(lián)合會(huì)議(JointConferenceonDigitalLibraries,JCDL)的錄用論文進(jìn)行整體回顧,梳理與分析當(dāng)下數(shù)字圖書館的研究?jī)?nèi)容與研究發(fā)現(xiàn),為我國(guó)相關(guān)領(lǐng)域?qū)W者把握學(xué)科前沿提供參考。[研究設(shè)計(jì)/方法]采用文獻(xiàn)綜述法,對(duì)本屆年會(huì)論文所反映的研究熱點(diǎn)與前沿進(jìn)行歸納總結(jié)與提煉。[結(jié)論/發(fā)現(xiàn)]本屆年會(huì)覆蓋研究主題廣泛,呈現(xiàn)出與數(shù)據(jù)科學(xué)協(xié)同合作的趨勢(shì),聚焦于用戶信息活動(dòng)的探索、未來圖書館的建設(shè)、細(xì)粒度化與精準(zhǔn)化智慧服務(wù)的提供等方面,具有較明顯的跨學(xué)科特性,且在新型冠狀病毒肺炎的公共衛(wèi)生危機(jī)下更加關(guān)注生物醫(yī)學(xué)信息學(xué)的價(jià)值。[創(chuàng)新/價(jià)值]揭示了當(dāng)前圖書情報(bào)與信息科學(xué)的研究熱點(diǎn)與趨勢(shì)。(2)文化遺產(chǎn)數(shù)字圖書館的需求與主流數(shù)字圖書館技術(shù)的開展同步。本屆年會(huì)關(guān)注書法、文學(xué)、民族音樂、篆刻[29]等傳統(tǒng)文化及歷史人物作品的保存和欣賞。文化遺產(chǎn)由于數(shù)據(jù)量小的特殊性,面臨著網(wǎng)絡(luò)訓(xùn)練的問題,Pang等[30]提供了一種以字形和筆畫特征擴(kuò)充書法圖像數(shù)據(jù)的方法,最終搭建了數(shù)字書法知識(shí)服務(wù)系統(tǒng)。Chudy等人[31]提出了基于dLibra數(shù)字圖書館的傳統(tǒng)音樂研究平臺(tái)MIRELA,可以支持音樂內(nèi)容的檢索。Adak等人[32]通過將甘地文學(xué)數(shù)字化并構(gòu)建時(shí)空社交網(wǎng)絡(luò),在Gandhipedia人工智能門戶網(wǎng)站形象地展示了圣雄甘地的生平事跡。虛擬現(xiàn)實(shí)(VR)技術(shù)被推薦為呈現(xiàn)文化遺產(chǎn)信息的一種創(chuàng)新媒介,Ng等人[33]通過對(duì)用戶報(bào)告和眼動(dòng)數(shù)據(jù)的分析,說明VR內(nèi)容中文本注釋有助于促進(jìn)用戶對(duì)文化遺產(chǎn)的理解,探討數(shù)字圖書館中文化遺產(chǎn)VR展示的最正確實(shí)踐。4新環(huán)境下以人為本的用戶研究探求精準(zhǔn)化理解用戶搜索行為——設(shè)計(jì)面向通用訪問的數(shù)字圖書館數(shù)字圖書館已成為用戶檢索信息的關(guān)鍵信息檢索系統(tǒng)。目前的搜索系統(tǒng)在為用戶尋找相關(guān)信息方面做得很好,但如何設(shè)計(jì)出能更好地支持用戶完成任務(wù)的搜索系統(tǒng),尤其是當(dāng)用戶面對(duì)復(fù)雜的搜索任務(wù)時(shí),還需要更多的研究[34]。本屆會(huì)議中Huang[35]與Wang團(tuán)隊(duì)[36]采用比擬研究的方法,分析任務(wù)的主、客觀難度對(duì)用戶搜索行為的影響,其他學(xué)者們從用戶學(xué)習(xí)過程和個(gè)性化的角度進(jìn)行了研究。Q)用戶信息搜索中的學(xué)習(xí)行為及過程探究。信息檢索并不是一個(gè)尋找特定問題答案的過程,而是一個(gè)探索和學(xué)習(xí)的過程[3刀。為了幫助提高知識(shí)獲取率,Zhang等人[38]將參與者繪制的思維導(dǎo)圖作為表示用戶知識(shí)的工具,從詞匯的視角研究用戶在信息搜索過程中的知識(shí)使用和變更,結(jié)果說明用戶的先驗(yàn)知識(shí)通過提供解決問題的結(jié)構(gòu)和制定查詢的詞匯庫來影響信息搜索。Liu等人[39]通過對(duì)不同領(lǐng)域用戶的定性研究,提出了探索性搜索中知識(shí)構(gòu)建過程的概念模型,該模型基于知識(shí)節(jié)點(diǎn)、知識(shí)社區(qū)和知識(shí)網(wǎng)絡(luò)等一系列核心過程。(2)將個(gè)性化技術(shù)用于用戶信息搜索領(lǐng)域,提高信息搜索效率。隨著個(gè)性化技術(shù)的進(jìn)步,基于偏好的web搜索成為可能。Hu等人[40]分別基于關(guān)聯(lián)規(guī)那么與二部圖方法開發(fā)了兩種個(gè)性化圖書推薦原型,將自動(dòng)個(gè)性化推薦服務(wù)整合到面向青少年讀者(尤其是小學(xué)學(xué)生)閱讀的在線學(xué)習(xí)平臺(tái)中。然而個(gè)性化技術(shù)也會(huì)導(dǎo)致泡沫過濾,不斷向用戶提供強(qiáng)化先驗(yàn)信念的信息,阻礙學(xué)習(xí)過程。針對(duì)此問題,Yamamoto等人[41]研究了一個(gè)網(wǎng)絡(luò)搜索界面PESONALITYFINDER,能夠?qū)€(gè)性化程度可視化,揭露和管理隱藏在個(gè)性中的網(wǎng)絡(luò)搜索結(jié)果,旨在使用戶意識(shí)到網(wǎng)絡(luò)搜索結(jié)果往往帶有偏見,進(jìn)而推動(dòng)關(guān)鍵信息搜索。智慧化構(gòu)建用戶服務(wù)體系——展現(xiàn)面向所有人的公共圖書館擔(dān)當(dāng)和社會(huì)包容數(shù)字圖書館的服務(wù)模式和服務(wù)內(nèi)容逐漸由文獻(xiàn)型向用戶型轉(zhuǎn)變[42],圖書館服務(wù)必須適應(yīng)用戶需求,提高內(nèi)容交付、易用性和服務(wù)響應(yīng)能力[43]o本屆年會(huì)相關(guān)研究也凸顯出這一趨勢(shì),利用圖書館大數(shù)據(jù)與用戶行為數(shù)據(jù)資源,充分關(guān)注用戶的興趣特征和數(shù)據(jù)內(nèi)容要求,從用戶的角度考慮當(dāng)前用戶需求的特點(diǎn),為數(shù)字圖書館現(xiàn)有服務(wù)的改進(jìn)提供有效的思路和方法。Q)了解用戶特征。性別是數(shù)字圖書館服務(wù)研究中通常被忽略的因素。為了研究閱讀偏好的性別差異,McKay等人[44]考察了性別與閱讀形式(印刷與在線)之間的相互作用,以了解數(shù)字閱讀是否會(huì)出現(xiàn)更多的性別越界閱讀。Jayawardena等人[45]通過眼動(dòng)測(cè)量,深入了解新手在閱讀研究論文時(shí)的掃描路徑。背景音樂服務(wù)已在智能圖書館中提供,Liu等人[46]基于音樂聲學(xué)特性、使用者個(gè)性特質(zhì)以及可穿戴腕帶所記錄的生理信號(hào),建立了一個(gè)音樂推薦系統(tǒng),指出個(gè)性特征對(duì)推薦準(zhǔn)確率的提高有顯著作用,而生理特征的貢獻(xiàn)較小。(2)改善用戶體驗(yàn)。用戶體驗(yàn)是衡量移動(dòng)圖書館服務(wù)質(zhì)量的重要指標(biāo),也是定位用戶需求的最終目標(biāo)。Zhao等人[47]基于以愉悅喚醒主導(dǎo)情感狀態(tài)模型和人格五因素模型,為移動(dòng)圖書館用戶情感體驗(yàn)的測(cè)量提供了一種有效的方法,對(duì)圖書館優(yōu)化移動(dòng)服務(wù)質(zhì)量具有重要的參考價(jià)值。Que等人[48]通過學(xué)術(shù)閱讀背景下的用戶對(duì)照實(shí)驗(yàn),對(duì)背景音樂對(duì)閱讀的影響進(jìn)行了實(shí)證研究,發(fā)現(xiàn)聽音樂不會(huì)影響讀者的閱讀質(zhì)量,且閱讀時(shí)聽自己選擇的背景音樂有助于保持積極的情緒,能夠?yàn)楦纳票尘耙魳废嚓P(guān)的服務(wù)提供參考。(3)關(guān)注特殊群體。本屆年會(huì)從不同角度展示了對(duì)邊緣化和社會(huì)隔離弱勢(shì)群體的支持。Weir等人[49]關(guān)注重度視障用戶的需求,開發(fā)了虛擬現(xiàn)實(shí)個(gè)人圖書館環(huán)境,幫助重度視障者克服行動(dòng)能力和閱讀理解能力的限制,獲得真實(shí)的閱讀體驗(yàn)和閱讀感受。Xie等人[50]比擬了盲人和視力正常用戶在使用數(shù)字圖書館(DL)進(jìn)行初步探索時(shí)采用的策略類型,結(jié)果說明視力正常用戶專注于瀏覽DL內(nèi)容,而盲人參與者專注于瀏覽DL結(jié)構(gòu),強(qiáng)調(diào)提供DL結(jié)構(gòu)概覽和快捷訪問對(duì)非線性瀏覽的重要性。Han等人[51]關(guān)注殘疾人的健康與體育意識(shí),提出了測(cè)定自走式輪椅坡度信息的方法,以提高輪椅使用者的活動(dòng)能力。用戶教育與信息素養(yǎng)——深入探索信息素養(yǎng)和數(shù)據(jù)素養(yǎng)的新方法、新模式和新挑戰(zhàn)在當(dāng)今數(shù)據(jù)密集和信息豐富的環(huán)境中,數(shù)字學(xué)習(xí)對(duì)教育、就業(yè)和生活質(zhì)量有著深遠(yuǎn)的影響,數(shù)據(jù)和信息素養(yǎng)(DIL)是當(dāng)代公民必備的關(guān)鍵素養(yǎng)。在本屆年會(huì)開展的"數(shù)據(jù)和信息素養(yǎng)”專題討論會(huì)[52]中,學(xué)者們介紹了近期為改善DIL教育所做的努力,以及中國(guó)信息素養(yǎng)的教育實(shí)踐和調(diào)查研究。黃如花教授以武漢大學(xué)"信息檢索MOOC"為例,闡述了中大型在線開放課程給DIL教學(xué)帶來的機(jī)遇、挑戰(zhàn)和未來展望。BillyTakHolLeng教授詳細(xì)介紹了澳門大學(xué)開辦的博雅系列活動(dòng)(BOYASeries),旨在通過圖書館舉辦的系列活動(dòng)來推動(dòng)信息素養(yǎng)教育。吳丹教授以COVID-19為背景,介紹了COVID-19疫情期間感染者和在治患者信息素養(yǎng)的調(diào)查研究,以及重大突發(fā)公共衛(wèi)生事件中電子健康信息素養(yǎng)教育標(biāo)準(zhǔn)的適用性及對(duì)策研究。5大數(shù)據(jù)背景下的信息計(jì)量與科學(xué)評(píng)價(jià)優(yōu)化科學(xué)文獻(xiàn)的深度挖掘——從多信息源科學(xué)文獻(xiàn)中提取和評(píng)價(jià)知識(shí)以科學(xué)文獻(xiàn)為中心的傳播方式是學(xué)術(shù)出版的主要形式。數(shù)字圖書館和在線搜索引擎支持了越來越多文章的存儲(chǔ)與關(guān)鍵詞檢索,在進(jìn)行科學(xué)研究時(shí),回顧已有科學(xué)文獻(xiàn)是一項(xiàng)煩瑣、費(fèi)時(shí)但又至關(guān)重要的研究活動(dòng)。本屆年會(huì)關(guān)注基于文獻(xiàn)的發(fā)現(xiàn)研究,從大量的科學(xué)文獻(xiàn)中尋找有效發(fā)現(xiàn)知識(shí)的方法,并促進(jìn)知識(shí)的利用。Q)使用知識(shí)圖進(jìn)行語義建模與科學(xué)領(lǐng)域表征。學(xué)術(shù)出版物的自然語言表達(dá)與其結(jié)構(gòu)化語義內(nèi)容建模之間的差距,影響了內(nèi)容的智能檢索,Vogt等人[53]結(jié)合本體構(gòu)建出研究貢獻(xiàn)模型(RCM),可將領(lǐng)域研究成果記錄轉(zhuǎn)化為語義知識(shí)圖,通過RDF的語義化來提升學(xué)術(shù)出版物的數(shù)字化水平。Oelen等人[54]利用開放研究知識(shí)圖(ORKG),提出了一種學(xué)術(shù)知識(shí)比擬的方法論和系統(tǒng),協(xié)'助科研人員快速熟悉某一研究領(lǐng)域。Zhang團(tuán)隊(duì)[55]提出利用LDA對(duì)真實(shí)世界主題關(guān)鍵字分布進(jìn)行建模,以解決領(lǐng)域知識(shí)圖(DKM)的統(tǒng)計(jì)評(píng)價(jià)問題,幫助構(gòu)建與描述特定領(lǐng)域的重要特征。(2)在信息過載的挑戰(zhàn)下幫助研究人員尋找合適的論文進(jìn)行引用。人們提出了許多自動(dòng)引文推薦方法,其中基于鄰近度的方法是研究重點(diǎn),如本屆年會(huì)中Farber和Sampath[56]根據(jù)相對(duì)較小的引用上下文發(fā)現(xiàn)并推薦以往的研究成果。為了實(shí)現(xiàn)對(duì)整個(gè)引文圖的全局了解,Pornprasit等人[5刀提出了一種用于引文知識(shí)圖嵌入的算法ConvCN,優(yōu)化了目前知識(shí)圖嵌入的最新技術(shù)ConvKBo(3)探索基于社交媒體的非正式交流研究。社交媒體的開展使學(xué)者們的學(xué)術(shù)交流不再局限于發(fā)表期刊文章,開始認(rèn)識(shí)到非正式出版和傳播實(shí)踐的重要性。Lin等人[58]基于論壇、博客等學(xué)術(shù)社交網(wǎng)站,研究了學(xué)者的非正式交流特征。Li等人[59]針對(duì)學(xué)術(shù)社會(huì)問答平臺(tái)上不同學(xué)科問題的語言特征差異,豐富和拓展了學(xué)術(shù)內(nèi)容語言特征差異的研究。然而,由于缺乏同行評(píng)審機(jī)制,社交媒體上學(xué)術(shù)用戶生成的內(nèi)容質(zhì)量參差不齊,Li等人[60]探索影響學(xué)者們對(duì)質(zhì)量評(píng)價(jià)的因素,可通過重新排序來改善搜索結(jié)果的有效性。科學(xué)評(píng)價(jià)的整合研究——向多準(zhǔn)那么、綜合化的公平原那么方向開展(1)系統(tǒng)地建模和量化研究或服務(wù)對(duì)學(xué)術(shù)社區(qū)和社會(huì)的影響。量化一個(gè)學(xué)者的研究影響最流行的方法之一是h_index[61],G_index[62]進(jìn)一步修改了h指數(shù),解決h指數(shù)難以識(shí)別發(fā)表論文數(shù)量少的學(xué)者的問題。除了研究影響,學(xué)者們的服務(wù)(如參加會(huì)議組織等活動(dòng))對(duì)研究成果的傳播起著重要作用,Han等人[63]提出并實(shí)施了三種G-index測(cè)量方法,從理論上分析和改進(jìn)了量化措施的預(yù)期行為。期刊影響因子是判斷期刊質(zhì)量的常用指標(biāo),但由于異常引用可以有目的地操縱影響因子,異常引文檢測(cè)是文獻(xiàn)計(jì)量的重點(diǎn)研究范疇。Jolly等人[64]提出了一個(gè)期刊級(jí)引文網(wǎng)絡(luò)無監(jiān)督異常檢測(cè)的新模型,利用箱線圖法和時(shí)間序列分析法對(duì)靜態(tài)異常和動(dòng)態(tài)異常進(jìn)行解析,顯示期刊的反常引文模式。Xu等人[64]采用多變量關(guān)系聚合學(xué)習(xí)方法獲取網(wǎng)絡(luò)環(huán)境下的多元關(guān)系信息,將可維持更大容量知識(shí)的多元高階結(jié)構(gòu)用于網(wǎng)絡(luò)的異常檢測(cè)。(2)健全完善學(xué)術(shù)評(píng)審制度。同行評(píng)議擁有大量的信息,不僅能供編輯和主編做出最終決定,還可以判斷論文的潛在影響。但近來關(guān)于評(píng)審質(zhì)量、偏見、甚至缺失的爭(zhēng)論很多[66-6刀。在本屆年會(huì)上,Bedmutha等人[68]強(qiáng)調(diào)了收取高額論文處理費(fèi),但卻未能提供嚴(yán)格同行評(píng)議程序的"掠奪性期刊"問題,并試圖開發(fā)一種利用文章內(nèi)容分析識(shí)別掠奪行為的方法。Hazra等人[69]根據(jù)作者在期刊上的接受程度對(duì)其進(jìn)行分類,指出同行評(píng)議系統(tǒng)可能會(huì)強(qiáng)化不同類別作者之間的接受度差異,從而引入潛在的歧視與不公平。這些批評(píng)使得同行評(píng)議數(shù)據(jù)集的研究變得非常重要,Chakraborty等[70]收集了ICLR(頂級(jí)機(jī)器學(xué)習(xí)會(huì)議之一)的同行評(píng)審數(shù)據(jù),構(gòu)建了基于方面的情感分析模型,發(fā)現(xiàn)被接受和被拒絕的論文在基于方面的情感方面存在顯著差異,情感強(qiáng)烈決定了評(píng)審的預(yù)期推薦。Weber[71]團(tuán)隊(duì)提出數(shù)據(jù)注釋能夠促進(jìn)數(shù)據(jù)透明度,改善對(duì)底層原材料的獲取,有助于將數(shù)據(jù)與具體主張聯(lián)系起來,更加準(zhǔn)確、徹底地審查一篇實(shí)證研究文章。(3)知識(shí)交流效率視角下的期刊論文監(jiān)察。Wu等人[72]將"引文峰值滯后”作為指標(biāo)衡量學(xué)科間知識(shí)傳播速度,說明LIS是高度跨學(xué)科的。而這也加速了無效或不可靠知識(shí)的傳播,F(xiàn)u等人[73]估計(jì)已有超過80萬篇文章直接引用了含有缺陷或錯(cuò)誤的回收論文,他們引入Keystone框架來跟蹤引用無效論文的影響,以選擇性地提醒最有可能受到論文錯(cuò)誤影響的作者。Yang等人[74]對(duì)科學(xué)回溯有缺陷的研究的實(shí)際影響進(jìn)行了量化,回答了撤稿如何影響被撤稿文章的引用次數(shù)和性質(zhì)的問題。6總結(jié)當(dāng)前社會(huì)的開展更加注重?cái)?shù)字生態(tài)系統(tǒng),而數(shù)字圖書館的開展正順應(yīng)了時(shí)代的開展趨勢(shì)。JCDL2020是一場(chǎng)數(shù)字圖書館研究人員和實(shí)踐者的盛會(huì),從理論、方法到實(shí)踐的多維視角匯集了全球圖書情報(bào)、信息科學(xué)、計(jì)算機(jī)科學(xué)等多學(xué)科領(lǐng)域?qū)W者的最新思考與研究成果,反映出當(dāng)下列圖書情報(bào)與信息科學(xué)相關(guān)研究領(lǐng)域的前沿?zé)狳c(diǎn)與趨勢(shì)動(dòng)態(tài)。Q)圖書情報(bào)學(xué)與數(shù)據(jù)科學(xué)協(xié)同合作的趨勢(shì)大數(shù)據(jù)時(shí)代給數(shù)字圖書館服務(wù)帶來了新的挑戰(zhàn)和變革的機(jī)遇,數(shù)字圖書館認(rèn)識(shí)到需要對(duì)研究數(shù)據(jù)進(jìn)行更深入的理解,以便能夠充分支持?jǐn)?shù)據(jù)密集型研究所產(chǎn)生數(shù)據(jù)的管理、共享和再利用。結(jié)合本屆年會(huì)論文的特點(diǎn)來看,科學(xué)研究正在向數(shù)據(jù)密集型研究轉(zhuǎn)變,數(shù)據(jù)科學(xué)在科學(xué)研究中的地位日益重要,圖書情報(bào)學(xué)與數(shù)據(jù)科學(xué)的協(xié)同合作是卓有成效的研究領(lǐng)域,也是未來的一種趨勢(shì)。(2)將以人為本的用戶研究思想應(yīng)用到數(shù)字圖書館建設(shè)從第一代基于數(shù)字化資源的數(shù)字圖書館,到第二代基于集成信息服務(wù)的數(shù)字圖書館,再到第三代基于用戶信息活動(dòng)的數(shù)字圖書館的演變[75]可以看出,信息技術(shù)在圖書館的應(yīng)用為用戶提供了更好、更便捷的信息服務(wù),也將圖書館用戶行為研究帶入了一個(gè)以人為本的新階段。本屆年會(huì)從精準(zhǔn)化理解用戶搜索行為、智慧化構(gòu)建用戶服務(wù)體系、用戶教育與信息素養(yǎng)的角度出發(fā),將圖書館服務(wù)無縫地、動(dòng)態(tài)地、交互地融入用戶的日常行為中,將服務(wù)的觸角延伸到一切有用戶存在的地方,真正表達(dá)了圖書館的服務(wù)本質(zhì)和社會(huì)使命。(3)提供更加細(xì)粒度的、知識(shí)的、語義的數(shù)字圖書館精準(zhǔn)服務(wù)語義框架為數(shù)字圖書館和存儲(chǔ)庫奠定了基礎(chǔ),使結(jié)構(gòu)化數(shù)據(jù)和信息能夠在當(dāng)今相互關(guān)聯(lián)的信息系統(tǒng)中表示和互操作。從本屆JCDL會(huì)議上的最新出版物可以看出,本體網(wǎng)絡(luò)不斷開展和語義建模技術(shù)的創(chuàng)新優(yōu)化,使得有充分的機(jī)會(huì)開發(fā)數(shù)字圖書館的豐富語義知識(shí),提供智能化與精準(zhǔn)化圖書館服務(wù),以適應(yīng)海量數(shù)字資源的大數(shù)據(jù)環(huán)境。(4)生物醫(yī)學(xué)信息學(xué)與醫(yī)學(xué)數(shù)據(jù)的治療價(jià)值成為學(xué)科研究的重要方向近期爆發(fā)的C0VID-19大流行使得生物醫(yī)學(xué)信息學(xué)的價(jià)值比基因組時(shí)代開始時(shí)更為明顯。本屆年會(huì)基于自然語言處理技術(shù)的藥物知識(shí)發(fā)現(xiàn)、電子病歷等研究,優(yōu)化生物醫(yī)學(xué)信息的獲取、存儲(chǔ)、挖掘所需的資源、方法和應(yīng)用,旨在發(fā)現(xiàn)能夠?yàn)獒t(yī)學(xué)研究增加價(jià)值的知識(shí),展示國(guó)際社會(huì)共同緩解當(dāng)前公共衛(wèi)生危機(jī)的努力。共享、可靠的知識(shí)是人類社會(huì)最珍貴的資源之一,JCDL2020圍繞"加快創(chuàng)新、可持續(xù)開展與轉(zhuǎn)型”主題,在數(shù)字圖書館的研究、實(shí)踐和教育等方面激發(fā)了新交流、新發(fā)現(xiàn)和新思路,這些最新研究成果表達(dá)了對(duì)促進(jìn)數(shù)據(jù)、信息和知識(shí)融通的重視,將有助于長(zhǎng)期滋養(yǎng)研究界。作者貢獻(xiàn)說明呂思妤:收集分析文獻(xiàn)資料,撰寫論文初稿;吳丹:提出研究思路,修改論文。PromotingtheIntegrationofData,InformationandKnowledge:LiteratureReviewontheJCDL2020國(guó)際數(shù)字圖書館聯(lián)合會(huì)議/數(shù)字圖書館/圖書情報(bào)學(xué)/數(shù)據(jù)科學(xué)/用戶研究期刊名稱:《圖書館學(xué)情報(bào)學(xué)》復(fù)印期號(hào):2021年09期[中圖分類號(hào)]G250[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1003-2797(2021)02-0110-111引言ACM/正EE數(shù)字圖書館聯(lián)合會(huì)議(JointConferenceonDigitalLibraries,JCDL)是數(shù)字圖書館領(lǐng)域歷史最悠久、學(xué)術(shù)性和影響力最大的頂級(jí)國(guó)際會(huì)議。JCDL由國(guó)際計(jì)算機(jī)學(xué)會(huì)(ACM)和電氣電子工程師協(xié)會(huì)(IEEE)聯(lián)合主辦,與歐洲數(shù)字圖書館會(huì)議(ECDL)、亞洲數(shù)字圖書館國(guó)際會(huì)議(ICADL)并稱為全球數(shù)字圖書館研究領(lǐng)域的三大國(guó)際學(xué)術(shù)會(huì)議,重點(diǎn)討論數(shù)字圖書館以及相關(guān)的技術(shù)、實(shí)踐和社會(huì)問題口]。首屆JCDL于2001年8月24日至28日在美國(guó)弗吉尼亞州羅阿諾克舉辦。自首屆舉辦以來的二十年間,JCDL吸引了來自世界各地涉及數(shù)字圖書館研究與實(shí)踐的學(xué)科和專業(yè)的人士參加,包括計(jì)算機(jī)科學(xué)、信息科學(xué)、圖書館學(xué)、檔案科學(xué)與實(shí)踐、博物館研究與實(shí)踐、醫(yī)學(xué)、社會(huì)科學(xué)和人文科學(xué)等,為各國(guó)專家學(xué)者提供了一個(gè)多學(xué)科交融、思想交鋒的平臺(tái),展示國(guó)際信息管理研究的最新前沿進(jìn)展。2020年8月1日至8月5日,由武漢大學(xué)信息管理學(xué)院和西北大學(xué)公共管理學(xué)院主辦的第二十屆JCDL會(huì)議在湖北武漢舉行,這是JCDL首次在亞洲舉辦。由于新型冠狀病毒肺炎(COVID-19)在全球肆虐,與以往歷屆JCDL會(huì)議不同,本次JCDL會(huì)議首次全部虛擬化,以線上形式召開。本次會(huì)議的主題為"加快創(chuàng)新、可持續(xù)開展與轉(zhuǎn)型"(SpeedierInnovation,SustainableDevelopment,SocietalTransformation),在COVID-19背景下該主題顯得更加迫切與真實(shí),同時(shí)會(huì)議的成功召開亦為武漢大學(xué)信息管理學(xué)院百年院慶系列活動(dòng)書寫了濃墨重彩的一筆。本文主要對(duì)本次年會(huì)相關(guān)論文的內(nèi)容進(jìn)行分析和總結(jié),重點(diǎn)介紹了各國(guó)學(xué)者的最新研究進(jìn)展,探討了數(shù)字圖書館領(lǐng)域的開展趨勢(shì),以期為國(guó)內(nèi)圖書館領(lǐng)域的學(xué)者提供幫助,全面了解本次年會(huì)及其最新研究趨勢(shì),掌握國(guó)際數(shù)字圖書館研究領(lǐng)域的前沿?zé)狳c(diǎn)問題。2年會(huì)概況收錄論文及作者國(guó)家(地區(qū))分布本屆年會(huì)共收到來自5大洲35個(gè)國(guó)家的980名數(shù)字圖書館及相關(guān)領(lǐng)域的專家學(xué)者的380余篇論文,會(huì)議來稿數(shù)量為歷屆之最。論文保持JCDL一貫以來的嚴(yán)格錄用標(biāo)準(zhǔn),經(jīng)程序委員會(huì)審查收錄了長(zhǎng)篇研究論文(FullResearchP叩er)33篇(錄用率31.1%),短篇研究論文(ShortResearchPaper)28篇(錄用率31.1%),以及海報(bào)(Poster)40篇和演示(Demonstration)8篇。雖身處不同時(shí)區(qū),但全球各地的與會(huì)者依然對(duì)會(huì)議保持了高度熱情,共有來自全球20余個(gè)國(guó)家和地區(qū)的約380名與會(huì)者線上參會(huì)。本屆年會(huì)的作者國(guó)家(地區(qū))分布如表1所示,相較于2019年,來自中國(guó)、美國(guó)、印度和德國(guó)的學(xué)者仍然是年會(huì)的核心。其中來自印度的學(xué)者有上升趨勢(shì),來自中國(guó)(含香港、澳門和臺(tái)灣地區(qū))的學(xué)者作為本屆年會(huì)的主力軍,其數(shù)量從2019年的43位增長(zhǎng)為118位(占比32.69%),充分體現(xiàn)了中國(guó)在圖書情報(bào)與信息管理研究與人才培養(yǎng)方面日益國(guó)際化的開展趨勢(shì)。另一方面,合著關(guān)系數(shù)據(jù)說明中國(guó)在領(lǐng)域內(nèi)的學(xué)術(shù)合作對(duì)象相對(duì)局限,需加強(qiáng)跨國(guó)合作的廣度和深度,增進(jìn)學(xué)術(shù)交流開展和國(guó)際影響力提升。年會(huì)相關(guān)學(xué)術(shù)活動(dòng)在為期5天的議程中,除了18場(chǎng)論文會(huì)議(PaperSession),2場(chǎng)專題討論會(huì)(Panel)、5場(chǎng)培訓(xùn)會(huì)(Tutorial)、7場(chǎng)研討會(huì)(Workshop)、1場(chǎng)海報(bào)和演示會(huì)議、1場(chǎng)博士生論壇(DoctoralConsortium)外,本屆年會(huì)新增了實(shí)踐案例(PractitionerTrack)模塊。這一創(chuàng)新為圖書館、檔案館和博物館的從業(yè)者和出版商以及數(shù)字內(nèi)容行業(yè)的合作伙伴提供了學(xué)術(shù)舞臺(tái),展示了與數(shù)字圖書館實(shí)踐和服務(wù)相關(guān)的前沿、探索性或有爭(zhēng)議的想法和實(shí)踐。收錄文獻(xiàn)關(guān)鍵詞分布對(duì)2020年JCDL文獻(xiàn)的關(guān)鍵詞分析顯示(圖1),本屆年會(huì)關(guān)注大數(shù)據(jù)時(shí)代下的數(shù)字圖書館如何建設(shè)。最高頻次的關(guān)鍵詞是DigitalLibrary(數(shù)字圖書館井口BigData(大數(shù)據(jù))。除此之外,DeepLearning(深度學(xué)習(xí)),WebArchiving(網(wǎng)絡(luò)資源存檔),Bibliometrics(計(jì)量學(xué)),DigitalPreservation(數(shù)字保存)均為出現(xiàn)頻次較高的關(guān)鍵詞。從關(guān)鍵詞分布來看,低頻關(guān)鍵詞占主要局部,關(guān)鍵詞間的頻次差距較小,覆蓋研究主題寬廣,具有較明顯的跨學(xué)科特性。圖12020年JCDL會(huì)議文獻(xiàn)關(guān)鍵詞詞云圖結(jié)合關(guān)鍵詞分析與文獻(xiàn)內(nèi)容分析,本屆年會(huì)收錄文獻(xiàn)涵蓋了與數(shù)字圖書館有關(guān)的廣泛主題,展現(xiàn)了核心研究領(lǐng)域、傳統(tǒng)研究領(lǐng)域和新興研究領(lǐng)域的研究進(jìn)展,為數(shù)字圖書館的創(chuàng)新與應(yīng)用創(chuàng)造更多技術(shù)形式,為圖書館體系結(jié)構(gòu)未來開展提供建議。下文將從互聯(lián)網(wǎng)技術(shù)下的未來數(shù)字圖書館探索、新環(huán)境下以人為本的用戶研究探求、大數(shù)據(jù)背景下的信息計(jì)量與科學(xué)評(píng)價(jià)優(yōu)化三個(gè)維度綜述本屆年會(huì)在不同研究領(lǐng)域所取得的最新進(jìn)展。3互聯(lián)網(wǎng)技術(shù)下的未來數(shù)字圖書館探索數(shù)字圖書館服務(wù)——提高現(xiàn)代公共服務(wù)的普及程度和便利性互聯(lián)網(wǎng)的出現(xiàn)和相關(guān)技術(shù)的開展,不僅增加了信息量,也改變了傳統(tǒng)圖書館和信息服務(wù)的性質(zhì)。數(shù)字圖書館已成為現(xiàn)代數(shù)字信息系統(tǒng)的重要組成局部。學(xué)術(shù)數(shù)據(jù)集和在線學(xué)術(shù)文獻(xiàn)檢索平臺(tái),如IEEE/正E電子圖書館、Wiley在線圖書館、施普林格LINK、谷歌學(xué)術(shù)檢索等,可以視為現(xiàn)代數(shù)字圖書館的代表。本屆年會(huì),學(xué)者們研究的圖書館范圍不僅限于存儲(chǔ)庫,還包括新形式的信息機(jī)構(gòu)、具有各種數(shù)字內(nèi)容的領(lǐng)域信息系統(tǒng)、數(shù)據(jù)工程與信息媒體等。Q)著眼未來數(shù)字圖書館構(gòu)建,加快傳統(tǒng)服務(wù)改進(jìn)與轉(zhuǎn)型。Fox[2]強(qiáng)調(diào)了5S框架(Societies,Scenarios,Spaces,Structures,Streams)又寸數(shù)字圖書館搜索、瀏覽、推薦和可視化等服務(wù)的建立與應(yīng)用的簡(jiǎn)化。Zhou[3]探討數(shù)字圖書館的數(shù)字生命周期程序,期望建立跨學(xué)科研究的平臺(tái)和大型聚合數(shù)字內(nèi)容的存儲(chǔ)庫,確保數(shù)字圖書館的廣大用戶能夠有效地獲取不同領(lǐng)域和平臺(tái)的聚合內(nèi)容。Liao[4]對(duì)圖書館智能服務(wù)的核心學(xué)術(shù)理論進(jìn)行梳理,整合為圖書館智慧服務(wù)核心要素的理論框架,有助于數(shù)字圖書館傳統(tǒng)服務(wù)向創(chuàng)新驅(qū)動(dòng)開展轉(zhuǎn)型。(2)加強(qiáng)數(shù)據(jù)工程建設(shè),開辟應(yīng)用支持新途徑。匹茲堡大學(xué)圖書館系統(tǒng)(ULS)的東亞圖書館(EAL)啟動(dòng)了當(dāng)代中國(guó)村落數(shù)據(jù)(CCVD)工程[5],建立了一個(gè)對(duì)中國(guó)人文和社會(huì)科學(xué)研究具有重要價(jià)值的數(shù)據(jù)集,包括政治、經(jīng)濟(jì)、社會(huì)學(xué)、環(huán)境科學(xué)、歷史和公共衛(wèi)生等領(lǐng)域的定量和定性數(shù)據(jù)。Jean-Caurant[6]的NewsEye工程訪問和調(diào)查了大量多語言報(bào)紙數(shù)據(jù),促進(jìn)學(xué)者和公眾對(duì)歷史報(bào)紙的研究。Ostendorff等人[7]致力于開放式法律數(shù)據(jù)平臺(tái)的開發(fā),為透明處理和開放訪問法律信息提供支持。(3)重視醫(yī)療數(shù)字化,探索數(shù)字圖書館醫(yī)療健康服務(wù)。Mohd[8]展現(xiàn)了基于醫(yī)療保健的C0VID-19相關(guān)出版物如何隨著時(shí)間的推移而變化,服務(wù)醫(yī)療一線、科學(xué)家、立法者等利益相關(guān)者對(duì)抗病毒。Wawrzinek等人[9]為藥物與疾病之間的復(fù)雜關(guān)系生成可直觀理解的短句解釋,能夠在藥物再利用等醫(yī)療任務(wù)中發(fā)揮核心作用。Zhenni等人[10-11]探討了基于電子病歷的疾病診斷、預(yù)測(cè)和篩選等熱點(diǎn)問題,通過健康檔案的數(shù)字化、網(wǎng)絡(luò)化與信息化提高護(hù)理質(zhì)量。(4)聚焦信息媒體,協(xié)助個(gè)人和社會(huì)形成意見與決策。社交媒體賬戶已逐漸成為普及信息和公眾溝通的主要平臺(tái),同時(shí)也帶來了假新聞和媒體所有權(quán)集中等社會(huì)問題。Spinde[12]團(tuán)隊(duì)創(chuàng)立了具有政治傾向標(biāo)簽的媒體數(shù)據(jù)集,并借助可視化手段傳達(dá)媒體偏見,幫助新聞消費(fèi)者意識(shí)到偏見的存在。Hamborg等人[13]通過詞匯選擇和標(biāo)簽(WCL)分析偏見的目標(biāo)依賴情緒,有助于對(duì)新聞文章傾向性和真實(shí)性的正確認(rèn)識(shí)。交叉融合圖書館開發(fā)技術(shù)創(chuàng)新——促進(jìn)數(shù)字資源的長(zhǎng)期保存和長(zhǎng)期可用性大數(shù)據(jù)具有大量、高速、多樣、低價(jià)值密度、真實(shí)性的特點(diǎn)。管理由不同來源聚合的多模式數(shù)據(jù)集,以確保數(shù)字資源的可用性,是一個(gè)日益嚴(yán)峻的數(shù)據(jù)管理挑戰(zhàn)。新一代信息技術(shù)如機(jī)器學(xué)習(xí)、深度學(xué)習(xí),特別是語言技術(shù)與數(shù)字圖書館的融合,已成為數(shù)字圖書館研究領(lǐng)域和本屆年會(huì)學(xué)者的重點(diǎn)研究課題。Q)將網(wǎng)絡(luò)資源存檔作為大數(shù)據(jù)源進(jìn)行統(tǒng)計(jì)和分析研究的勢(shì)頭正穩(wěn)步上升。相較于傳統(tǒng)網(wǎng)絡(luò)檔案,如何從網(wǎng)絡(luò)資源存檔數(shù)據(jù)中識(shí)別出高質(zhì)量的文檔被Patel等人口4]關(guān)注,以對(duì)原始數(shù)字材料提供更有意義的訪問。Adewoye等人[15]提供了一種使用圖像查詢?cè)诰W(wǎng)絡(luò)資源存檔中快速找到相關(guān)圖像的方法。Ruest等人[16]介紹了始于2017年的檔案釋放工程,該研究成果也適用于推特、電子郵件、電子文檔和演示文稿,以及大量的原始數(shù)字記錄。WARC是Web存檔廣泛使用的文件格式,Wang等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論