一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)-以北京大學(xué)圖書館為例_第1頁
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)-以北京大學(xué)圖書館為例_第2頁
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)-以北京大學(xué)圖書館為例_第3頁
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)-以北京大學(xué)圖書館為例_第4頁
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)-以北京大學(xué)圖書館為例_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、    一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)以北京大學(xué)圖書館為例    摘要:通過調(diào)研國內(nèi)外數(shù)據(jù)驅(qū)動研究現(xiàn)狀、趨勢和用戶需求,分析研究數(shù)據(jù)管理服務(wù)的國內(nèi)外發(fā)展情況,研究提出高校研究數(shù)據(jù)管理服務(wù)體系,并介紹北京大學(xué)研究數(shù)據(jù)管理服務(wù)的研究成果、框架設(shè)計、構(gòu)建經(jīng)驗與服務(wù)效果,為高校建設(shè)一流研究數(shù)據(jù)管理服務(wù)、支持用戶數(shù)據(jù)驅(qū)動研究范式需求,提供研究與實踐經(jīng)驗。以促進(jìn)數(shù)據(jù)驅(qū)動研究,推動開放科學(xué)。關(guān)鍵詞:數(shù)據(jù)驅(qū)動研究,研究數(shù)據(jù)管理,數(shù)據(jù)服務(wù)體系,數(shù)據(jù)服務(wù),數(shù)據(jù)政策1引言隨著云計算、移動互聯(lián)網(wǎng)的應(yīng)用普及,以及可穿戴智能設(shè)備的出現(xiàn),一場全新的、以大規(guī)模數(shù)據(jù)生產(chǎn)、分享、

2、使用為代表的技術(shù)革命正在發(fā)生,數(shù)據(jù)成為寶貴的資源、資產(chǎn)和生產(chǎn)要素。對海量數(shù)據(jù)及其隱含信息、知識的收集、分析、挖掘、有效整合,將為科學(xué)研究、社會經(jīng)濟(jì)發(fā)展帶來巨大的紅利。大數(shù)據(jù)的廣泛應(yīng)用開啟了一個全新的智能時代1。2017年,以谷歌阿爾法狗(alphago)和阿爾法元(alphazero)為代表,深度學(xué)習(xí)技術(shù)取得突破,標(biāo)志著人工智能元年到來。大數(shù)據(jù)和人工智能時代,世界各國對數(shù)據(jù)的依賴快速上升,搶占大數(shù)據(jù)發(fā)展先機(jī),已成為國家戰(zhàn)略。美國、日本、韓國、中國、歐盟等國家和地區(qū)紛紛將大數(shù)據(jù)利用上升為國家戰(zhàn)略,積極推進(jìn)數(shù)據(jù)政策,希望利用大數(shù)據(jù)技術(shù)實現(xiàn)研究和產(chǎn)業(yè)領(lǐng)域的突破2。數(shù)據(jù)科學(xué)已經(jīng)成為全球高校發(fā)展最快的專

3、業(yè)。數(shù)據(jù)科學(xué)社區(qū)(data science community)的數(shù)據(jù)顯示,截至2018年12月,全球共有26個國家的361所高校開設(shè)了597個數(shù)據(jù)科學(xué)相關(guān)學(xué)位專業(yè),其中美國高校開設(shè)的數(shù)據(jù)科學(xué)專業(yè)數(shù)量最多。全美有247所高校共設(shè)置461個數(shù)據(jù)科學(xué)學(xué)位專業(yè),占全球總量的77%3。在中國,2016年2月,北京大學(xué)、對外經(jīng)濟(jì)貿(mào)易大學(xué)、中南大學(xué)首次成功申請到“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”本科新專業(yè)。2017年3月,第二批32所高校獲批。2018年3月,教育部公布的高校新增專業(yè)名單中,有248所學(xué)校獲批,是過去兩次審批通過額度的近8倍4。2017年11月24日至2018年4月3日,由北京大學(xué)圖書館和北京大學(xué)信

4、息管理系發(fā)起與組織,多家機(jī)構(gòu)合作,成功舉辦了“首屆全國高校數(shù)據(jù)驅(qū)動創(chuàng)新研究大賽”(以下簡稱大賽)。大賽吸引了全國眾多高校學(xué)生積極參與。比賽期間,有近4萬用戶訪問大賽主頁,共吸引來自北京大學(xué)等全國169所高校的1892名同學(xué)報名參賽,共有593組隊伍,涉及56個一級學(xué)科。最終,來自121所高校的968人(共289支隊伍)成功提交了參賽作品,涉及45個一級學(xué)科。成功提交作品最多的前20個一級學(xué)科中,圖書館、情報和檔案學(xué)科隊伍最多,達(dá)到59組,其次是應(yīng)用經(jīng)濟(jì)學(xué)、社會學(xué)、管理科學(xué)與工程、計算機(jī)科學(xué)、統(tǒng)計學(xué)也分別達(dá)到達(dá)50組、27組、23組、19組、19組。在通過形式審核的233篇論文中,有103篇論文

5、使用平臺已有數(shù)據(jù),135篇論文使用自產(chǎn)的原創(chuàng)性數(shù)據(jù),同時使用平臺已有數(shù)據(jù)和自己原創(chuàng)數(shù)據(jù)的共有5篇。參賽隊伍使用數(shù)據(jù)情況與筆者前期調(diào)研情況表明:數(shù)據(jù)已是絕大多數(shù)學(xué)科研究的基礎(chǔ),研究者需要高質(zhì)量的大數(shù)據(jù)提交、發(fā)布和研究服務(wù)平臺;高質(zhì)量調(diào)查數(shù)據(jù)、招聘數(shù)據(jù)與社交媒體數(shù)據(jù)仍是人文社科經(jīng)濟(jì)學(xué)領(lǐng)域研究者重點關(guān)注的研究數(shù)據(jù)。隨著數(shù)據(jù)量與數(shù)據(jù)需求的飛速增長,大數(shù)據(jù)和海量數(shù)據(jù)的管理、共享、發(fā)布和保存面臨著巨大的成本與效率考驗。研究數(shù)據(jù)的存儲形式、存儲容量與存儲效率制約著研究使用數(shù)據(jù)規(guī)模與利用形式,成為研究數(shù)據(jù)管理的挑戰(zhàn)。重視與發(fā)展研究數(shù)據(jù)的管理與服務(wù),已成為國家層面與科研機(jī)構(gòu)未來提升學(xué)術(shù)競爭力和影響力的重要發(fā)展戰(zhàn)

6、略之一。2018年4月2日,國務(wù)院國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知,以研究數(shù)據(jù)全生命周期為中心,加強(qiáng)和規(guī)范研究數(shù)據(jù)的管理,推動開放共享5。順應(yīng)教學(xué)和研究需求,建設(shè)一流的研究數(shù)據(jù)管理服務(wù)體系,提供研究數(shù)據(jù)支撐服務(wù),成為全球研究型圖書館的必然選擇。本文將調(diào)研國內(nèi)外研究數(shù)據(jù)管理服務(wù)的發(fā)展情況,提出建設(shè)研究數(shù)據(jù)管理服務(wù)體系的建議。并以北京大學(xué)研究數(shù)據(jù)管理服務(wù)體系的建設(shè)經(jīng)驗為例,為圖書館推動研究數(shù)據(jù)管理服務(wù)提供參考。2研究綜述原中國科學(xué)院圖書館館長張曉林指出,在全學(xué)科數(shù)據(jù)驅(qū)動研究成為趨勢的時代,圖書館需要重新定義服務(wù)目標(biāo)、內(nèi)容、方式和能力,在大數(shù)據(jù)的基礎(chǔ)上,基于新技術(shù)和方法,提供全新知識服務(wù)。

7、美國麻省理工學(xué)院、美國國家醫(yī)學(xué)圖書館和英國大英圖書館等都已經(jīng)調(diào)整戰(zhàn)略,融匯數(shù)據(jù)資源,重構(gòu)知識服務(wù)的平臺、機(jī)制6。原上海圖書館館長吳建中通過對20年來全球知識開放運(yùn)動的梳理和分析,提出研究數(shù)據(jù)管理對推進(jìn)知識開放和共享的重要意義,并提出4點建議:加大宣傳力度,增強(qiáng)開放共享意識;制定相關(guān)政策,推進(jìn)開放科學(xué)發(fā)展;整合各類資源,建設(shè)數(shù)字基礎(chǔ)設(shè)施;培育專業(yè)人才,提升數(shù)據(jù)管理水平7。國際上,研究數(shù)據(jù)作為科學(xué)研究的重要成果受到國際學(xué)術(shù)界和出版界越來越多的重視。2009年以來,美國、英國、澳大利亞、歐盟等國家和地區(qū)紛紛出臺開放數(shù)據(jù)政策。2011年,美國自然科學(xué)基金委要求項目申請書必須包含“數(shù)據(jù)管理計劃”8,美國

8、多個資助機(jī)構(gòu)的數(shù)據(jù)管理政策陸續(xù)發(fā)布。歐盟與歐洲資助機(jī)構(gòu)出臺一系列數(shù)據(jù)政策。2011年,英國聯(lián)合信息系統(tǒng)委員會(joint information systems committee)和電子科學(xué)核心計劃(e-science core programme)聯(lián)合組建的“國家數(shù)據(jù)監(jiān)管中心(national digital curation center)”發(fā)布制定數(shù)據(jù)管理與共享計劃9。英國皇家學(xué)會(royal society)于2012年7月發(fā)布報告科學(xué)是開放事業(yè)(science as an open enterprise),確立共享和開放科學(xué)數(shù)據(jù)的基本原則、機(jī)遇與面臨的挑戰(zhàn)10。歐盟2020計劃規(guī)定

9、,2017年開始全面實施科研數(shù)據(jù)開放制度,推動“開放科學(xué)”戰(zhàn)略11。截至2018年6月,在資助機(jī)構(gòu)開放獲取政策查詢數(shù)據(jù)庫sherpa/juliet中,144個資助機(jī)構(gòu),41個資助機(jī)構(gòu)政策中要求必須開放研究數(shù)據(jù),19個機(jī)構(gòu)鼓勵開放12。在各種政策驅(qū)動下,研究數(shù)據(jù)管理倉儲發(fā)展迅速。截至2018年12月,根據(jù)國際研究數(shù)據(jù)倉儲注冊組織(registry of research data repositories)的統(tǒng)計,全世界至少有2250多個研究數(shù)據(jù)倉儲13。哈佛大學(xué)等世界頂尖高校均建立了自己的數(shù)據(jù)倉儲。科學(xué)數(shù)據(jù)出版期刊不斷涌現(xiàn),2011年2月,美國科學(xué)(science)刊登“數(shù)據(jù)處理(dealin

10、g with data)”專題14,wiley公司于2012年推出了期刊地球科學(xué)數(shù)據(jù)(geoscience data journal)15,自然集團(tuán)在2014年推出期刊科學(xué)數(shù)據(jù)(scientific data)16,中國科學(xué)院也于2016年推出期刊中國科學(xué)數(shù)據(jù)17,研究數(shù)據(jù)逐漸成為出版領(lǐng)域搶占的制高點。數(shù)據(jù)引用及引文數(shù)據(jù)庫也得到越來越多的應(yīng)用,原湯森路透公司于2012年在web of science中推出了“數(shù)據(jù)引用索引”(data citation index),用于數(shù)據(jù)的檢索和引用跟蹤。國家、基金會和機(jī)構(gòu)數(shù)據(jù)政策推動數(shù)據(jù)管理服務(wù)需求,研究數(shù)據(jù)管理(research data managem

11、ent,rdm)成為研究型圖書館的重要服務(wù),相關(guān)研究與實踐發(fā)展迅速??_·泰諾普(carol tenopir)等在2016年2月向333個歐洲大學(xué)圖書館發(fā)送郵件調(diào)查研究數(shù)據(jù)管理服務(wù)的開展情況,共有119個圖書館回復(fù)郵件。90%以上的圖書館都已經(jīng)開展或計劃開展研究數(shù)據(jù)的管理計劃制定、培訓(xùn)、開發(fā)等服務(wù),31.9%的圖書館已經(jīng)參與到研究項目中,提供數(shù)據(jù)服務(wù)18。阿楊.尹(ayoung yoon)等在2015年10月12月期間,對185個美國研究型大學(xué)圖書館的網(wǎng)站進(jìn)行調(diào)查分析后,發(fā)現(xiàn)美國研究型圖書館開展的研究數(shù)據(jù)管理服務(wù)主要包括:咨詢幫助(help/ask librarians,79.5%)

12、、數(shù)據(jù)管理(data deposit,60%)、研究數(shù)據(jù)管理計劃(data management planning,41.1%)、數(shù)據(jù)咨詢(data consultation,38.4%)、數(shù)據(jù)出版和共享(data publishing and sharing,27.6%)、數(shù)據(jù)方法(data methodology,15.7%)19。2017年3月,美國聯(lián)機(jī)計算機(jī)圖書館中心(online computer library center,oclc)發(fā)布“研究數(shù)據(jù)管理現(xiàn)實”系列報告,報告以12個北美、歐洲和澳大利亞的圖書館的研究為基礎(chǔ),重點對愛丁堡大學(xué)(英國)、伊利諾伊大學(xué)厄巴納香檳分校(美國)

13、、蒙納士大學(xué)(澳大利亞)和瓦赫寧根大學(xué)(荷蘭)等4所大學(xué)的服務(wù)進(jìn)行案例分析,研究這些機(jī)構(gòu)的研究數(shù)據(jù)管理能力,總結(jié)研究數(shù)據(jù)管理服務(wù)為三大領(lǐng)域:教育類、解決方案類和長期保存類20。澳大利亞國際數(shù)據(jù)服務(wù)中心(the australian national data service)提出數(shù)據(jù)管理能力的5個要素:政策和流程、信息架構(gòu)、服務(wù)能力、元數(shù)據(jù)管理和研究數(shù)據(jù)管理。并給出五個發(fā)展階段的成熟度21。伊蓮·馬?。╡laine r. martin)提出基于圖書館以用戶為中心開展數(shù)據(jù)管理服務(wù)的框架,主要涵蓋:數(shù)據(jù)服務(wù)、數(shù)據(jù)管理實踐指導(dǎo)、信息素養(yǎng)、存檔保存和政策服務(wù)22。英國的數(shù)字策管中心(the

14、digital curation centre)根據(jù)研究生命周期,提出研究數(shù)據(jù)管理支持服務(wù)框架應(yīng)涵蓋:政策和規(guī)劃、可持續(xù)性發(fā)展、研究數(shù)據(jù)管理計劃、元數(shù)據(jù)管理、數(shù)據(jù)存儲、數(shù)據(jù)存檔策略、數(shù)據(jù)管理、培訓(xùn)指南等23。于飛(fei yu)等(2017年)介紹了澳大利亞昆士蘭大學(xué)在對大學(xué)用戶進(jìn)行調(diào)查后,設(shè)計與開展基于生命周期的研究數(shù)據(jù)管理服務(wù)內(nèi)容包括:研究數(shù)據(jù)管理計劃和準(zhǔn)備(數(shù)據(jù)指南、數(shù)據(jù)培訓(xùn)、研究數(shù)據(jù)管理計劃等);研究過程支持服務(wù)(數(shù)據(jù)工具、管理和分析、培訓(xùn)等);數(shù)據(jù)保存、出版和傳播(數(shù)據(jù)發(fā)布平臺、長期保存和數(shù)據(jù)出版等)。見圖124。圖1澳大利亞昆士蘭大學(xué)研究數(shù)據(jù)管理服務(wù)內(nèi)容3研究數(shù)據(jù)管理服務(wù)體系的設(shè)計

15、與建設(shè)2015年,北京大學(xué)圖書館制定2018行動計劃,調(diào)整組織機(jī)構(gòu),重新組織與設(shè)計服務(wù),將原系統(tǒng)部更名為信息化與數(shù)據(jù)中心,設(shè)置數(shù)據(jù)管理與服務(wù)崗位,全面開展研究數(shù)據(jù)管理平臺、工具和服務(wù)建設(shè),設(shè)計數(shù)據(jù)管理服務(wù)框架。另外組建研究支持中心,設(shè)置數(shù)據(jù)館員,開展信息素養(yǎng)和數(shù)據(jù)咨詢等服務(wù)。數(shù)據(jù)資源成為資源建設(shè)的重要組成部分。2015年12月25日,北京大學(xué)圖書館正式發(fā)布開放研究數(shù)據(jù)服務(wù)平臺(以下簡稱“開放數(shù)據(jù)平臺”)、機(jī)構(gòu)知識庫、開放出版期刊網(wǎng)和學(xué)者主頁,構(gòu)建新型學(xué)術(shù)交流生態(tài)系統(tǒng),推動開放獲取與研究數(shù)據(jù)管理服務(wù),成為國內(nèi)高校相關(guān)建設(shè)的引領(lǐng)者。并在開放數(shù)據(jù)平臺的基礎(chǔ)上,開展平臺、服務(wù)、培訓(xùn)、政策制定與推進(jìn)等一

16、系列研究和服務(wù)工作,推動北京大學(xué)建設(shè)成為研究數(shù)據(jù)匯集、管理與服務(wù)的引領(lǐng)者。3.1需求調(diào)研2013年起,筆者團(tuán)隊從調(diào)研開始,定位研究者需求,掌握國際發(fā)展動態(tài),開發(fā)數(shù)據(jù)服務(wù)平臺,全面推廣服務(wù),完成北京大學(xué)研究數(shù)據(jù)管理服務(wù)框架的初步構(gòu)建,為未來研究和服務(wù)奠定基礎(chǔ)。圖2列出北京大學(xué)研究數(shù)據(jù)管理服務(wù)的建設(shè)歷程。圖2北京大學(xué)研究數(shù)據(jù)管理服務(wù)的建設(shè)歷程2014年,筆者團(tuán)隊對校內(nèi)教師進(jìn)行問卷調(diào)查,獲取50份教師的反饋,并對26名教師進(jìn)行一對一需求訪談。調(diào)研發(fā)現(xiàn):高達(dá)87.5%的受訪者愿意在一定條件下開放研究數(shù)據(jù),開放的最大動機(jī)是通過開放數(shù)據(jù),提升數(shù)據(jù)價值、提高成果引用率與增強(qiáng)數(shù)據(jù)曝光度。開放的最大疑慮是他人利

17、用數(shù)據(jù)搶先發(fā)表成果。開放條件中,受訪者最需要“審核使用者身份和數(shù)據(jù)使用用途后提供”功能。通過調(diào)研,準(zhǔn)確定位研究者對研究數(shù)據(jù)管理服務(wù)的實際需求。一對一訪談發(fā)現(xiàn):數(shù)據(jù)開放程度與學(xué)科特點密切。對于數(shù)據(jù)驅(qū)動、數(shù)據(jù)密集特征明顯的學(xué)科,數(shù)據(jù)開放比較標(biāo)準(zhǔn)和規(guī)范,可以推進(jìn)到原始數(shù)據(jù)的程度,例如社會調(diào)查學(xué)科和生物信息學(xué)科。在生物信息學(xué)科,發(fā)表期刊時發(fā)表數(shù)據(jù)已經(jīng)是趨勢,大多向期刊指定數(shù)據(jù)庫提交,或者自己建立數(shù)據(jù)庫。對于其他學(xué)科,數(shù)據(jù)開放也存在,但向大多數(shù)同行開放的僅是整理后的成果數(shù)據(jù),原始數(shù)據(jù)只與直接合作者共享。數(shù)據(jù)開放具有明顯的時滯期。幾乎所有的學(xué)者都強(qiáng)調(diào),數(shù)據(jù)必須在自己的成果發(fā)表之后,才考慮開放。這與學(xué)者對“數(shù)據(jù)被他人搶先發(fā)表成果”的擔(dān)心是一致的。研究數(shù)據(jù)開放行為多為學(xué)者自發(fā),缺乏政策激勵機(jī)制和維護(hù)更新平臺,缺乏基于數(shù)據(jù)引用、認(rèn)可和學(xué)術(shù)聲譽(yù)的良性反饋,亟需規(guī)范的數(shù)據(jù)服務(wù)平臺。2017年,筆者對校內(nèi)本科生與研究生的課程調(diào)研發(fā)現(xiàn):全校約26個院系開設(shè)數(shù)據(jù)驅(qū)動研究的研究

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論