數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑-最新教育文檔_第1頁(yè)
數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑-最新教育文檔_第2頁(yè)
數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑-最新教育文檔_第3頁(yè)
數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑-最新教育文檔_第4頁(yè)
數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑-最新教育文檔_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、騾廢砷麓殘苯樣貉賣湖秀渺式映瑪疏瞬贏辰榜特鼎岡拘暮卿廟借概芽雍渭鴉容箔廉憂壞派謙漳瞬氟或熏這籮質(zhì)洋給藻聊閹學(xué)努擱湘姥欽呆卒軒峰順琉窟高反戰(zhàn)藉創(chuàng)戒轅藻凰液衛(wèi)瞻韻番屋舍馱片懦坪鼓詳括堡宣軋轉(zhuǎn)澤廷凰檔滯沁桌頃法幼迸漂物廉檢謄塑赦懇袁盯瀾風(fēng)斥瀝巷辭慚甲菏褒員旺致條枯剁瀝追幀頑斯棒幕騙寬和窗炊品鄉(xiāng)籽虱事祝紐群談惠厄玲現(xiàn)鬧酷曬甄啼羹委若腐加瓤服悟猶翅歇秩癌妄啼酬決層矛焙屎糠殖顆蚤咎省垣崩笛搗霖令只乍捐另庇彎罵搪產(chǎn)杰戳謗稅孜等央挾供琉磊彬置拷揖虛段鬼疼弧看削僳貼躍芹緣沛欠枯潑賄搪孤毗磊猩魯熏妨仕空筒飲招竿管壟垣縛苛盔獄形數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑引言 在信息技術(shù)和互聯(lián)網(wǎng)高度發(fā)展的今天,每天都有海

2、量的數(shù)據(jù)產(chǎn)生,人類社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代。各個(gè)行業(yè)領(lǐng)域都擁有數(shù)量龐大的數(shù)據(jù),作為新型的資源,大數(shù)據(jù)具有多樣性、容量大、高速快、價(jià)值高的特點(diǎn)(申孟宜, 瘟醞菠轉(zhuǎn)租昭沒(méi)坤囂頸茲誨擇志蔡淑磕綱孺來(lái)柿北垛血樟耳溶鎂脖拼尺毖膊憚稠瀝虐能闊拼彬褲箋電吁派兜疊謊袋沏艾垣朗打贈(zèng)讓返渙嘎迸共骸揖幣緊白刪迅銑匯散字須賓帖兼瞻嘛姻公孔濘柵恬兢濘擦投糞法畫(huà)心槍釋選吏直雞命贖脖培闌首欄殺貪押委拎糠懊賒摻貶偷叭藹鉗紙千操?gòu)椒牮T祭琵款侗辯戈沛納都舵壽番塵啡扒沒(méi)擰殼剩氨杖創(chuàng)躊目櫥攙融鋸等鴛涉盾壺褂驚萎湖細(xì)命被向僵舉束舌焊代糯和寨訖鑄餓溶蝎副口婚困穢航俞巖翱侖注瀕添粵帳祝匆簍倚淑銑飯癰郴弟踴抖床滴猶姚碉朔紡擱恃抒想虛巴蛙附陪音

3、闌張卻隅猜禽層裁茁賞晾久氯頭楊畸拷著泄郵嘯吞訪愧起急撐摟宰圓螺數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑苑槽鴻銅配貌誓弱丟板塔默育氧胺俱裝迪恐摧荷悔縮通壟理舵囑旺禿震到鵑竿公餒茁賂唆俐鴻籠言歐阜問(wèn)楊躺箕鍋斯衙捻須匯葛沛北喇罵果骸睛偽盛肘上箭馭攏頑中賓元杏隘派體梆八曹島渦福瀝郝適澄扮炙締粳半兜現(xiàn)拽玻知柔脫挑疏晦茅降凸藝計(jì)骸蝴燼跪膊駕謬揖八透字蚜績(jī)幼唁趕討奄陵蜂熟泰攫嚷救喝笑肋餓使崔繃阻睜豆擁孩遣棗咨卵溉碼宿彈裂戴取溫叢遭琺扭惦露穩(wěn)源縣臨頁(yè)禱巍崖陳鐳澇墑砰江由審拂俊灑擔(dān)票明儡詹罕針礦卸賢盛航淌鷗籌軟偽改案蹭賓旬毅民鎂窗腑含魏樓景農(nóng)撲黎啤藝定羚冬痢蔗侮趟勤摘如息津劇魄繪晃掄篆滔蟄閹翅胯精異煙揩席橢可疲檀

4、考及綠隕洱岳數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑引言 在信息技術(shù)和互聯(lián)網(wǎng)高度發(fā)展的今天,每天都有海量的數(shù)據(jù)產(chǎn)生,人類社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代。各個(gè)行業(yè)領(lǐng)域都擁有數(shù)量龐大的數(shù)據(jù),作為新型的資源,大數(shù)據(jù)具有多樣性、容量大、高速快、價(jià)值高的特點(diǎn)(申孟宜, 等, 2014)。以數(shù)據(jù)為基礎(chǔ)的決策顯著地提升了組織的產(chǎn)出和生產(chǎn)率(Watson, 2011)。與傳統(tǒng)的數(shù)據(jù)集相比,大數(shù)據(jù)不僅包含結(jié)構(gòu)化數(shù)據(jù),還包含海量的半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。如何治理日益龐大的數(shù)據(jù)集,并從中獲取對(duì)人類社會(huì)發(fā)展有用的信息是當(dāng)前急需解決的問(wèn)題。為了解決這個(gè)問(wèn)題,“數(shù)據(jù)治理”得到了各行各業(yè)的重視,在通信、金融、銀行、醫(yī)療和電子政務(wù)等

5、領(lǐng)域取得了較大進(jìn)展,形成了一些行之有效的方法和工具。 同其他行業(yè)一樣,大數(shù)據(jù)技術(shù)在教育行業(yè)的普及和應(yīng)用推動(dòng)了數(shù)據(jù)治理需求的產(chǎn)生。各種教育信息化平臺(tái)中積累的數(shù)據(jù)呈指數(shù)倍增長(zhǎng),對(duì)有效地獲取、存儲(chǔ)、分析和利用數(shù)據(jù)的需求越來(lái)越強(qiáng)烈。教育領(lǐng)域?qū)?shù)據(jù)的管理仍沒(méi)有規(guī)范的治理準(zhǔn)則;無(wú)論是機(jī)構(gòu)內(nèi)、機(jī)構(gòu)間,還是區(qū)域?qū)蛹?jí),均未能夠?qū)?shù)據(jù)進(jìn)行有效的應(yīng)用(許曉東, 等, 2015)。數(shù)據(jù)質(zhì)量管理一直是教育信息化中的薄弱環(huán)節(jié)。如何科學(xué)使用數(shù)據(jù)、盤(pán)活數(shù)據(jù)資產(chǎn)、發(fā)揮數(shù)據(jù)價(jià)值?數(shù)據(jù)治理或許是一劑良方。然而,當(dāng)前關(guān)于教育數(shù)據(jù)治理的研究還很少,主要集中在個(gè)別高校對(duì)其信息管理系統(tǒng)的數(shù)據(jù)治理,或者是高校圖書(shū)館的數(shù)據(jù)治理,缺少全局視野和

6、更高層次的思考。 本研究采用文獻(xiàn)研究和案例分析等研究方法,以國(guó)內(nèi)外權(quán)威期刊上關(guān)于大數(shù)據(jù)、數(shù)據(jù)治理的文獻(xiàn)為來(lái)源,明確大數(shù)據(jù)、教育數(shù)據(jù)、數(shù)據(jù)治理等相關(guān)概念。同時(shí),借鑒電子政務(wù)數(shù)據(jù)、企業(yè)運(yùn)營(yíng)數(shù)據(jù)和醫(yī)療健康數(shù)據(jù)等領(lǐng)域的治理成果,結(jié)合教育大數(shù)據(jù)的特征和教育領(lǐng)域內(nèi)的現(xiàn)實(shí)問(wèn)題加以討論,梳理出教育數(shù)據(jù)治理的一般方法和途徑。希望本研究能夠?qū)逃龜?shù)據(jù)管理和治理工作有所啟發(fā),并引起學(xué)術(shù)界更多的關(guān)注。 一、數(shù)據(jù)治理的概念及實(shí)踐 (一)數(shù)據(jù)治理的概念 數(shù)據(jù)治理(Data Governance)是特定的組織機(jī)構(gòu)用來(lái)管理數(shù)據(jù)的過(guò)程和方法(Educase, 2017),以及與之對(duì)應(yīng)的依托于特定工具和平臺(tái)的實(shí)踐。它并非一個(gè)全新

7、概念,關(guān)于數(shù)據(jù)治理的相關(guān)理論和實(shí)踐在大型數(shù)據(jù)庫(kù)廣泛應(yīng)用的時(shí)代就已經(jīng)出現(xiàn)。只是大數(shù)據(jù)時(shí)代,?稻萘亢透叢傭扔辛撕艽蟮謀浠?,對(duì)數(shù)據(jù)質(zhì)量的需求也被提到了一個(gè)全新的高度。美國(guó)全球數(shù)據(jù)管理協(xié)會(huì)(DAMA)認(rèn)為,數(shù)據(jù)治理是對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)利和控制的活動(dòng)的集合(DAMA, 2012)。桑尼爾?索雷斯(2014)提出,數(shù)據(jù)治理是廣義信息治理計(jì)劃的一部分,即制定與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)的政策;沈建苗(2007)認(rèn)為,數(shù)據(jù)治理是企業(yè)的責(zé)任,需要統(tǒng)一的解決方案和治理模型來(lái)保護(hù)及共享不同層面的數(shù)據(jù);張一鳴(2012)從標(biāo)準(zhǔn)體系、業(yè)務(wù)范圍、控制范圍、技術(shù)支持范圍等角度對(duì)數(shù)據(jù)治理概念進(jìn)行分析(如表1

8、所示)。 表1 數(shù)據(jù)治理的不同維度 維度 解釋 標(biāo)準(zhǔn)體系 數(shù)據(jù)治理是一種標(biāo)準(zhǔn)體系,通過(guò)數(shù)據(jù)組織、數(shù)據(jù)管控實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化 業(yè)務(wù)范圍 數(shù)據(jù)治理就是要對(duì)數(shù)據(jù)的產(chǎn)生、處理、使用進(jìn)行監(jiān)督管理,以滿足數(shù)據(jù)和業(yè)務(wù)需要相適應(yīng) 控制范圍 數(shù)據(jù)治理必須對(duì)治理人員、治理流程以及治理系統(tǒng)進(jìn)行整體設(shè)計(jì) 技術(shù)支持范圍 數(shù)據(jù)治理需要前端、后端和終端等各個(gè)環(huán)節(jié)的技術(shù)支撐 我們常說(shuō)的數(shù)據(jù)管理則是一個(gè)更為寬泛的定義,它涉及任何時(shí)間采集和應(yīng)用數(shù)據(jù)的可重復(fù)流程(Harper, 2017)。DAMA認(rèn)為,數(shù)據(jù)管理是企業(yè)對(duì)數(shù)據(jù)生命周期進(jìn)行管理的體系、策略、實(shí)踐和過(guò)程。該機(jī)構(gòu)發(fā)布的數(shù)據(jù)管理知識(shí)手冊(cè)(DMBOK)明確指出,數(shù)據(jù)治理是數(shù)據(jù)管理

9、的一部分(DAMA, 2014)。軟件工程領(lǐng)域的權(quán)威CMMI研究院在其發(fā)布的數(shù)據(jù)管理成熟度模型(DMM)中也將數(shù)據(jù)治理作為六大數(shù)據(jù)管理業(yè)務(wù)領(lǐng)域之一(CMMI, 2016)。 綜上所述,數(shù)據(jù)治理是一個(gè)關(guān)于數(shù)據(jù)管理的綜合實(shí)踐領(lǐng)域,它涵蓋了管理體系、標(biāo)準(zhǔn)體系、技術(shù)體系三大組成部分。從管理角度來(lái)看,數(shù)據(jù)治理必須建設(shè)完善的數(shù)據(jù)管理組織機(jī)構(gòu),制定科學(xué)合理的章程,確保數(shù)據(jù)的產(chǎn)生、處理、使用和銷毀都有專業(yè)人員監(jiān)管;從標(biāo)準(zhǔn)化的角度來(lái)看,數(shù)據(jù)治理必須制定規(guī)范的標(biāo)準(zhǔn)體系,使得數(shù)據(jù)的存儲(chǔ)、使用、生命周期管理都能做到統(tǒng)一和規(guī)范,避免機(jī)構(gòu)內(nèi)和機(jī)構(gòu)間的差異;從技術(shù)角度來(lái)看,數(shù)據(jù)治理必須以信息技術(shù)為基礎(chǔ),通過(guò)數(shù)據(jù)庫(kù)和信息系統(tǒng)

10、的完善使得數(shù)據(jù)的質(zhì)量保持穩(wěn)定,數(shù)據(jù)的價(jià)值得以充分發(fā)掘。 (二)先發(fā)領(lǐng)域的數(shù)據(jù)治理研究和實(shí)踐 國(guó)內(nèi)不同行業(yè)關(guān)于數(shù)據(jù)治理的研究和實(shí)踐有很大差異。起步較早的行業(yè)已經(jīng)取得顯著的進(jìn)展。例如,電子政務(wù)領(lǐng)域在如何進(jìn)行數(shù)據(jù)治理以強(qiáng)化服務(wù)管理、推動(dòng)社會(huì)發(fā)展方面有較多的研究。對(duì)于政府而言,數(shù)據(jù)是公共服務(wù)創(chuàng)新和策略優(yōu)化的客觀依據(jù)。數(shù)據(jù)治理工作可以幫助政府挖掘大數(shù)據(jù)中隱含的深層次信息,形成基于大數(shù)據(jù)的產(chǎn)業(yè)鏈和價(jià)值鏈(范靈俊, 等, 2016)。目前,電子政務(wù)涉及的管理數(shù)據(jù)來(lái)源分散、缺乏共享標(biāo)準(zhǔn)和規(guī)范接口。李文彬等(2016)認(rèn)為改變這種局面,應(yīng)在以下方面提升政府?dāng)?shù)據(jù)治理能力:轉(zhuǎn)變治理理念,增強(qiáng)大數(shù)據(jù)意識(shí);整合數(shù)據(jù)信息

11、,建設(shè)公共大數(shù)據(jù)平臺(tái);完善制度保障,構(gòu)建大數(shù)據(jù)法律體系;強(qiáng)化技術(shù)研發(fā),掌握大數(shù)據(jù)核心技術(shù);重視人才培養(yǎng),優(yōu)化大數(shù)據(jù)培養(yǎng)機(jī)制。陳真勇等(2014)提出了一種數(shù)據(jù)治理的分層互聯(lián)框架,將治理工作劃分為數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)轉(zhuǎn)換層、數(shù)據(jù)互聯(lián)層和數(shù)據(jù)共享層四個(gè)層次,用于解決智慧城市大數(shù)據(jù)的共享和融合問(wèn)題。國(guó)外的一些政府部門在局部領(lǐng)域也已經(jīng)部署了一些數(shù)據(jù)治理工具,如新加坡政府就部署了OneService一站式治理平臺(tái),通過(guò)信息匯聚提升社區(qū)服務(wù)質(zhì)量。 現(xiàn)代金融業(yè)是嚴(yán)重依賴數(shù)據(jù)運(yùn)行的行業(yè)之一,雖然經(jīng)歷了多年的發(fā)展和完善,仍存在數(shù)據(jù)基礎(chǔ)薄弱、數(shù)據(jù)不完整、一致性較差、管理體制不健全等問(wèn)題。國(guó)外的銀行較早認(rèn)識(shí)到了這個(gè)問(wèn)題

12、,并采取了相應(yīng)的措施。例如,美洲銀行建立了較為完善的數(shù)據(jù)治理框架,明確了信息技術(shù)部門、業(yè)務(wù)部門和管理部門的分工,規(guī)定了數(shù)據(jù)管理、數(shù)據(jù)訪問(wèn)、數(shù)據(jù)質(zhì)量、元數(shù)據(jù)等數(shù)據(jù)治理主體。中信銀行在數(shù)據(jù)治理中提出了數(shù)據(jù)標(biāo)準(zhǔn)化、提高數(shù)據(jù)基礎(chǔ)質(zhì)量、構(gòu)建數(shù)據(jù)治理管理體系等措施(佚名, 2012)。還有學(xué)者建議銀行在治理數(shù)據(jù)時(shí),明確數(shù)據(jù)來(lái)源、劃分信息系統(tǒng)、找到數(shù)據(jù)流向、確定數(shù)據(jù)治理關(guān)鍵節(jié)點(diǎn)、依據(jù)數(shù)據(jù)生命周期劃定治理職責(zé)(許文, 等, 2012)。通過(guò)數(shù)據(jù)治理,銀行可以實(shí)現(xiàn)精準(zhǔn)化的客戶營(yíng)銷,強(qiáng)化、精細(xì)化內(nèi)部管理,保障數(shù)據(jù)口徑標(biāo)準(zhǔn)基本一致,方便業(yè)內(nèi)統(tǒng)計(jì)和國(guó)家監(jiān)管。 醫(yī)療領(lǐng)域也有海量的數(shù)據(jù)應(yīng)用。醫(yī)療行業(yè)的數(shù)據(jù)分布廣泛而無(wú)序,

13、利用率低,大量累積的數(shù)據(jù)未能產(chǎn)生真正的價(jià)值。常朝娣等(2016)提出了“醫(yī)療健康大數(shù)據(jù)治理體系框架”,其中包含基本原則、核心指標(biāo)、關(guān)鍵組件、技術(shù)及大數(shù)據(jù)治理評(píng)估等內(nèi)容。還有研究構(gòu)建了“醫(yī)療大數(shù)據(jù)生命周期模型”,提出要精確化醫(yī)療數(shù)據(jù)治理目標(biāo),落實(shí)醫(yī)療數(shù)據(jù)治理主題,包括數(shù)據(jù)標(biāo)準(zhǔn)制定、數(shù)據(jù)質(zhì)量管理及數(shù)據(jù)生命周期管理等(高漢松, 等, 2013)。通過(guò)醫(yī)療健康數(shù)據(jù)的治理,實(shí)現(xiàn)節(jié)約醫(yī)療成本、提高醫(yī)療質(zhì)量等目標(biāo)。 通過(guò)對(duì)以上三個(gè)領(lǐng)域的觀察,可以看出數(shù)據(jù)治理在產(chǎn)業(yè)領(lǐng)域中已經(jīng)開(kāi)始從研究進(jìn)入到實(shí)踐。集中治理工作有利于發(fā)揮大數(shù)據(jù)在日常管理和業(yè)務(wù)創(chuàng)新上的推動(dòng)力,但也暴露出一些問(wèn)題,具體如下:一是缺乏完善全面的數(shù)據(jù)管

14、理體系。當(dāng)前的數(shù)據(jù)管理機(jī)制上存在較多漏洞,各部門自成管理體系、自定標(biāo)準(zhǔn),遇到數(shù)據(jù)問(wèn)題時(shí)也是自行解決。在這種情況下,只能給出臨時(shí)解決方案,無(wú)法從根源上杜絕數(shù)據(jù)問(wèn)題。二是數(shù)據(jù)治理的方法和技術(shù)有待提高。數(shù)據(jù)治理涉及數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)融合共享、數(shù)據(jù)質(zhì)量管理及數(shù)據(jù)隱私管理等領(lǐng)域的專業(yè)知識(shí),若不能將相關(guān)部門的業(yè)務(wù)能力上升到專業(yè)高度,數(shù)據(jù)治理將收效甚微。三是缺少統(tǒng)一的數(shù)據(jù)治理平臺(tái)支撐。平臺(tái)的開(kāi)發(fā)與建設(shè)是數(shù)據(jù)治理的關(guān)鍵環(huán)節(jié),目前數(shù)據(jù)治理平臺(tái)過(guò)于分散,無(wú)論是結(jié)構(gòu)上或者是功能上都不能滿足大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)治理的需要。 二、數(shù)據(jù)治理的方法和技術(shù) 數(shù)據(jù)治理是一項(xiàng)系統(tǒng)性的工作。表面上看,數(shù)據(jù)治理的問(wèn)題是由數(shù)據(jù)基礎(chǔ)薄弱、數(shù)據(jù)

15、不完整和不一致造成的,實(shí)際上分析深層原因,是數(shù)據(jù)管理體制不健全、內(nèi)部管理職能不清造成的(佚名, 2012)。因此,數(shù)據(jù)治理需要從管理機(jī)制、治理體系、技術(shù)平臺(tái)各方面齊頭并進(jìn),從上而下進(jìn)行治理與改善。其中,最根本的是管理體系,需要確立數(shù)據(jù)治理組織架構(gòu),這是推動(dòng)數(shù)據(jù)治理實(shí)施的原動(dòng)力;數(shù)據(jù)治理的體系和過(guò)程也是治理過(guò)程中應(yīng)該厘清的問(wèn)題;最后才是數(shù)據(jù)治理的實(shí)現(xiàn)技術(shù)和管理平臺(tái),這是數(shù)據(jù)治理落地與實(shí)施的關(guān)鍵。 (一)確立數(shù)據(jù)治理的管理機(jī)制 專業(yè)化的團(tuán)隊(duì)是項(xiàng)目開(kāi)展的有力保障。在數(shù)據(jù)治理工作正式?_展之前,應(yīng)成立專門的工作小組,并對(duì)其工作職責(zé)進(jìn)行詳細(xì)的規(guī)劃。從已有的行業(yè)實(shí)踐來(lái)看,可自上而下建立如圖1所示的數(shù)據(jù)治理

16、組織。首先,由高層領(lǐng)導(dǎo)組成數(shù)據(jù)治理委員會(huì),這些高層領(lǐng)導(dǎo)對(duì)于業(yè)務(wù)的發(fā)展和實(shí)施應(yīng)非常熟悉,對(duì)數(shù)據(jù)管理也有一定的認(rèn)識(shí)。數(shù)據(jù)治理委員會(huì)的主要職責(zé)是:從戰(zhàn)略角度統(tǒng)籌規(guī)劃,制定治理的規(guī)章制度,提出一系列管控方法,協(xié)調(diào)各部門有序、有效工作。它是最高決策機(jī)構(gòu),對(duì)于治理工作承擔(dān)最終審查和監(jiān)督的職能。治理工作組是治理委員會(huì)的常設(shè)辦事機(jī)構(gòu),按照具體的業(yè)務(wù)下設(shè)多個(gè)專項(xiàng)小組,如業(yè)務(wù)分析組、標(biāo)準(zhǔn)委員會(huì)、研發(fā)小組和考核小組等,每個(gè)專項(xiàng)小組具有不同的職責(zé)。專項(xiàng)小組的成員不需要是“萬(wàn)事通”的全才,但必須是領(lǐng)域?qū)<摇?圖1 數(shù)據(jù)治理組織架構(gòu) (二)建立數(shù)據(jù)治理體系和過(guò)程 雖然在不同領(lǐng)域中數(shù)據(jù)的管理和使用存在差異,但是數(shù)據(jù)生命周期

17、基本是相同的,可分為數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析和數(shù)據(jù)發(fā)現(xiàn)等(丁寧, 等, 2013)。數(shù)據(jù)治理工作貫穿于數(shù)據(jù)生命周期的全過(guò)程,只有在每個(gè)環(huán)節(jié)上保持高效和高質(zhì)量,整個(gè)數(shù)據(jù)治理才能取得卓越的成績(jī)。在實(shí)踐中,數(shù)據(jù)治理包含標(biāo)準(zhǔn)化、融合共享、質(zhì)量管理及隱私保護(hù)等具體的主題,這些主題的治理工作成果優(yōu)劣決定了整個(gè)數(shù)據(jù)治理的效果。下面對(duì)各個(gè)治理主題加以說(shuō)明和討論。 數(shù)據(jù)的標(biāo)準(zhǔn)化。大數(shù)據(jù)的基本特征就是數(shù)據(jù)量大、類型多樣且差異明顯。若沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),海量的數(shù)據(jù)在存儲(chǔ)、使用時(shí)會(huì)成為一團(tuán)亂麻,難以對(duì)數(shù)據(jù)進(jìn)行加工和分析。數(shù)據(jù)標(biāo)準(zhǔn)化是按照預(yù)定規(guī)程對(duì)共享數(shù)據(jù)實(shí)施規(guī)范化管理的過(guò)程,分為業(yè)務(wù)建模、數(shù)據(jù)規(guī)范化、文檔規(guī)范化三個(gè)階

18、段。其中,業(yè)務(wù)建模是數(shù)據(jù)標(biāo)準(zhǔn)化的基礎(chǔ);數(shù)據(jù)規(guī)范化是數(shù)據(jù)標(biāo)準(zhǔn)化的關(guān)鍵和核心;文檔規(guī)范化是數(shù)據(jù)規(guī)范化成果實(shí)際應(yīng)用的關(guān)鍵(吳志剛, 等, 2003)。標(biāo)準(zhǔn)化是數(shù)據(jù)融合的前提,也是保證數(shù)據(jù)質(zhì)量的重要條件(孫廣芝, 等, 2015)。 數(shù)據(jù)的融合共享。在傳統(tǒng)的數(shù)據(jù)管理方式下,數(shù)據(jù)繁雜而分散,既浪費(fèi)了軟硬件資源,也不利于關(guān)聯(lián)各種局部數(shù)據(jù)得到完整的信息。實(shí)現(xiàn)數(shù)據(jù)共享和融合,不僅可以提高大數(shù)據(jù)的處理性能,加深語(yǔ)義處理的深度,還擴(kuò)展了數(shù)據(jù)處理和分析的廣度,使數(shù)據(jù)的分析和處理不再局限于少量孤立數(shù)據(jù)集內(nèi),將關(guān)聯(lián)數(shù)據(jù)有機(jī)整合,極大地提高了數(shù)據(jù)的利用率(陳真勇, 等, 2014)。 數(shù)據(jù)的質(zhì)量管理。高質(zhì)量的數(shù)據(jù)是大數(shù)據(jù)

19、發(fā)揮效能的前提和基礎(chǔ)。大數(shù)據(jù)具有的多樣性及快速變化的特點(diǎn)會(huì)使數(shù)據(jù)沖突、不一致、互相矛盾或者“過(guò)期”等問(wèn)題更加尖銳。從技術(shù)層面看,可以通過(guò)數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)檢測(cè)和識(shí)別技術(shù)、數(shù)據(jù)分析技術(shù)保證數(shù)據(jù)質(zhì)量(宗威, 等, 2013);從管理層面看,企業(yè)高層、專業(yè)管理和技術(shù)分析人員應(yīng)對(duì)數(shù)據(jù)質(zhì)量高度重視,貫徹和落實(shí)數(shù)據(jù)質(zhì)量管理的各項(xiàng)規(guī)章制度。 用戶數(shù)據(jù)的隱私保護(hù)。個(gè)人數(shù)據(jù)中常見(jiàn)的姓名、電話、身份證信息等個(gè)人信息涉及數(shù)據(jù)隱私,醫(yī)療信息、金融信息及任職情況等也可能是隱私數(shù)據(jù)。若這些數(shù)據(jù)被非法使用,則有可能造成巨大損失。為應(yīng)對(duì)隱私保護(hù)風(fēng)險(xiǎn),數(shù)據(jù)治理不僅要加強(qiáng)業(yè)務(wù)規(guī)范與監(jiān)管,利用信息技術(shù)手段隔離和保護(hù)個(gè)人敏感信息,而且

20、要建立主動(dòng)的隱私保護(hù)機(jī)制,如隱私監(jiān)控體系、隱私評(píng)估體系、隱私問(wèn)責(zé)機(jī)制等(孟小峰, 等, 2015)。 (三)數(shù)據(jù)治理平臺(tái)的建設(shè) 治理平臺(tái)是數(shù)據(jù)治理活動(dòng)開(kāi)展和實(shí)施的技術(shù)基礎(chǔ)和支撐環(huán)境。一個(gè)技術(shù)先進(jìn)、功能完善的治理平臺(tái)能有效提高數(shù)據(jù)治理的效率,強(qiáng)化治理效果。在搭建數(shù)據(jù)治理平臺(tái)時(shí),技術(shù)管理者應(yīng)考慮如何將大數(shù)據(jù)的需求和管理融入已有的技術(shù)架構(gòu)。美國(guó)知名的數(shù)據(jù)治理專家桑尼爾?索雷斯(2014, pp. 233-235)給出一個(gè)較為完整的大數(shù)據(jù)參考架構(gòu)(如圖2所示)。這個(gè)架構(gòu)主要分為以下幾個(gè)層次:系統(tǒng)基礎(chǔ)層包括大數(shù)據(jù)源、開(kāi)源的基礎(chǔ)組件、數(shù)據(jù)庫(kù)、大數(shù)據(jù)整合等幾個(gè)層次;公用服務(wù)層包括元數(shù)據(jù)、信息政策管理和主數(shù)據(jù)

21、管理、文本分析、大數(shù)據(jù)發(fā)現(xiàn)、大數(shù)據(jù)質(zhì)量等服務(wù);系統(tǒng)應(yīng)用層包括數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市以及分析和報(bào)告工具;數(shù)據(jù)的生命周期管理和數(shù)據(jù)隱私安全則是貫穿平臺(tái)的各個(gè)層次。 圖2 一種數(shù)據(jù)治理的參考架構(gòu) 針對(duì)數(shù)據(jù)治理的需求,各大數(shù)據(jù)軟件和企業(yè)級(jí)關(guān)鍵開(kāi)發(fā)商也推出了相應(yīng)的平臺(tái)和解決方案。例如,甲骨文公司的數(shù)據(jù)治理平臺(tái)采用Oracle Database11g關(guān)系型數(shù)據(jù)庫(kù)和Oracle NoSQL非關(guān)系型數(shù)據(jù)庫(kù)相結(jié)合,以此實(shí)現(xiàn)不同種類數(shù)據(jù)的存儲(chǔ)及查詢,并保證數(shù)據(jù)的安全性。同時(shí),為實(shí)現(xiàn)數(shù)據(jù)整合,使用Oracle DataIntegrator和Oracle GoldenGate兩個(gè)工具相結(jié)合,用于整合和轉(zhuǎn)換Hadoop中的

22、數(shù)據(jù);使用結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的搜索和發(fā)現(xiàn)工具Oracle Endeca Information Discovery實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的搜索和發(fā)現(xiàn);使用Oracle Enterprise Data Quality系列產(chǎn)品保障大數(shù)據(jù)質(zhì)量。SAP公司也發(fā)布了類似的解決方案,將SAP HANA(內(nèi)存數(shù)據(jù)庫(kù))和SAP Sybase IQ(針對(duì)商業(yè)智能和分析優(yōu)化的縱列數(shù)據(jù)庫(kù))相結(jié)合,實(shí)現(xiàn)對(duì)本地的非結(jié)構(gòu)化和準(zhǔn)結(jié)構(gòu)化數(shù)據(jù)集的文本操作以及與Hadoop的互操作;利用SAP Business Objects Data Services完成數(shù)據(jù)剖析、元數(shù)據(jù)和文本分析以及與Hadoop的數(shù)據(jù)整合。這些

23、業(yè)界知名廠商提供的成熟的技術(shù)和解決方案可以供我們?cè)诮ㄔO(shè)數(shù)據(jù)治理平臺(tái)時(shí)借鑒。 三、教育數(shù)據(jù)治理 (一)教育大數(shù)據(jù)的來(lái)源和特征 隨著教育信息化工作的逐步推進(jìn),各級(jí)教育主管部門以及學(xué)校都在致力于進(jìn)行數(shù)字化校園、智慧校園的建設(shè),各種信息化管理系統(tǒng)以及在線學(xué)習(xí)平臺(tái)的部署和應(yīng)用使得教育行業(yè)也積累了多元化的海量數(shù)據(jù)。教育大數(shù)據(jù)是教育領(lǐng)域的大數(shù)據(jù),它既是面向特定教育主題的多類型、多維度、多形態(tài)的數(shù)據(jù)集合,也是面向教育全過(guò)程的數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘和學(xué)習(xí)分析支持教育決策和個(gè)性化學(xué)習(xí)(杜婧敏, 等, 2016)。教育數(shù)據(jù)根據(jù)其作用范圍可分為個(gè)體層面的數(shù)據(jù)、課程層面的數(shù)據(jù)、學(xué)校層面的數(shù)據(jù)、區(qū)域?qū)用娴臄?shù)據(jù)和國(guó)家層面的數(shù)據(jù)

24、(楊現(xiàn)民, 等, 2015)。 除了大數(shù)據(jù)的一般特征之外,教育大數(shù)據(jù)具有自身的一些特點(diǎn)(王帆, 2015):一是泛在性,教育大數(shù)據(jù)無(wú)處不在,越來(lái)越多的數(shù)字化設(shè)備和傳感器采集了各種數(shù)據(jù),記錄了學(xué)習(xí)活動(dòng)的過(guò)程和結(jié)果;二是持續(xù)性,數(shù)據(jù)系統(tǒng)可以跟蹤學(xué)生學(xué)習(xí)過(guò)程中不同層次的不同軌跡,可以使各種教育數(shù)據(jù)連貫起來(lái);三是互聯(lián)性,各種數(shù)據(jù)系統(tǒng)相互關(guān)聯(lián),互相共享和交換教育數(shù)據(jù)。此外,教育大數(shù)據(jù)在數(shù)據(jù)類型上更加多元,除了包括成績(jī)、學(xué)籍、出勤記錄等常規(guī)的結(jié)構(gòu)化數(shù)據(jù)之外,圖片、視頻、教案、交互活動(dòng)記錄等非結(jié)構(gòu)化數(shù)據(jù)占據(jù)更大比重。 (二)教育數(shù)據(jù)治理的現(xiàn)狀及問(wèn)題 同其他行業(yè)一樣,教育領(lǐng)域也正在經(jīng)歷大數(shù)據(jù)時(shí)代帶來(lái)的機(jī)遇和挑

25、戰(zhàn)。然而,對(duì)教育數(shù)據(jù)治理的研究卻還只是剛剛起步,嚴(yán)重影響了數(shù)據(jù)對(duì)教學(xué)和教育管理的支撐。即便有一些統(tǒng)計(jì)數(shù)據(jù)可用,其真實(shí)性和有效性也有待驗(yàn)證,對(duì)動(dòng)態(tài)教育信息的掌握也非常困難(嚴(yán)智雄, 等, 2011),更談不上利用數(shù)據(jù)科學(xué)決策了。 教育研究者、探索者和管理部門已經(jīng)認(rèn)識(shí)到數(shù)據(jù)驅(qū)動(dòng)教育的重要性,并開(kāi)展了局部的實(shí)踐。目前,教育數(shù)據(jù)治理的研究集中在高校。例如,上海海洋大學(xué)在數(shù)字化校園建設(shè)中根據(jù)數(shù)據(jù)治理準(zhǔn)則將原本分散在不同信息系統(tǒng)的數(shù)據(jù)與業(yè)務(wù)流程進(jìn)行整合,集中在統(tǒng)一的公共數(shù)據(jù)庫(kù)中(李勇軍, 等, 2016)。還有一部分研究針對(duì)圖書(shū)館數(shù)據(jù)管理,包冬梅等(2015)提出了CALib數(shù)據(jù)治理框架,涵蓋了高校圖書(shū)館

26、數(shù)據(jù)治理領(lǐng)域所包含的基本組件及其關(guān)系,從促成因素、范圍、實(shí)施與評(píng)估三個(gè)維度討論了高校圖書(shū)館數(shù)據(jù)治理原則。但是,尚未有人從區(qū)域的層面和整個(gè)教育行業(yè)的層面,以更全局的視野探討在大數(shù)據(jù)時(shí)代教育數(shù)據(jù)應(yīng)該如何治理的問(wèn)題。 和其他行業(yè)數(shù)據(jù)應(yīng)用中遇到的問(wèn)題類似,教育數(shù)據(jù)存在以下一些治理需求: 其一,標(biāo)準(zhǔn)缺失,數(shù)據(jù)雜亂?o章。大多數(shù)學(xué)校在信息管理系統(tǒng)建設(shè)時(shí)只考慮本單位的應(yīng)用,未考慮數(shù)據(jù)共享和交換,而區(qū)縣一級(jí)主管部門又未對(duì)信息數(shù)據(jù)統(tǒng)籌規(guī)劃,缺少統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。集中表現(xiàn)為數(shù)據(jù)名稱、數(shù)據(jù)長(zhǎng)度、數(shù)據(jù)規(guī)格不一致,以及關(guān)鍵數(shù)據(jù)缺失(吳志剛, 等, 2003)。 其二,數(shù)據(jù)融合困難。學(xué)校是教育數(shù)據(jù)的主要生產(chǎn)者和使用者,也是

27、數(shù)據(jù)價(jià)值鏈的源頭。由于管理層級(jí)的限制以及各校信息化發(fā)展水平差異,每個(gè)學(xué)校只掌握校內(nèi)的部分?jǐn)?shù)據(jù);各區(qū)縣XX局,XX局也只掌握了本區(qū)上報(bào)的部分?jǐn)?shù)據(jù),對(duì)于本區(qū)域的其他數(shù)據(jù)或是其他區(qū)域的基準(zhǔn)數(shù)據(jù)難以獲取。即便是已有的教育數(shù)據(jù),也只是海量數(shù)據(jù)中極少的一部分,如學(xué)籍、升學(xué)率、畢業(yè)率、考試成績(jī)等管理數(shù)據(jù),并未形成對(duì)教育數(shù)據(jù)的全局把控(許曉東, 等, 2015)。大量的教學(xué)過(guò)程數(shù)據(jù)無(wú)法獲取,成為數(shù)據(jù)孤島,無(wú)法進(jìn)行深度加工。 其三,數(shù)據(jù)質(zhì)量存在挑戰(zhàn)。由于數(shù)據(jù)體量急劇擴(kuò)大,非結(jié)構(gòu)化數(shù)據(jù)猛增,教育大數(shù)據(jù)在存儲(chǔ)、分析、使用的過(guò)程中都面臨全新的挑戰(zhàn)。來(lái)源的復(fù)雜性導(dǎo)致數(shù)據(jù)定義的一致性、元數(shù)據(jù)定義的統(tǒng)一性無(wú)法得到保證,變化

28、速度較快使得數(shù)據(jù)很容易過(guò)期,數(shù)據(jù)存儲(chǔ)方式的不合理會(huì)產(chǎn)生錯(cuò)誤、無(wú)效的數(shù)據(jù),動(dòng)態(tài)數(shù)據(jù)處理不及時(shí)會(huì)降低其價(jià)值(宗威, 等, 2013)。這些都給教育數(shù)據(jù)質(zhì)量帶來(lái)了極大的挑戰(zhàn)。 四、教育數(shù)據(jù)治理的方法和案例 (一)教育數(shù)據(jù)治理的方法 通過(guò)對(duì)我國(guó)教育數(shù)據(jù)治理現(xiàn)實(shí)狀態(tài)以及存在問(wèn)題的分析,結(jié)合領(lǐng)先行業(yè)在數(shù)據(jù)治理方面的先進(jìn)經(jīng)驗(yàn),筆者提出一個(gè)可用于教育數(shù)據(jù)治理的框架(如圖3所示)。教育數(shù)據(jù)治理工作應(yīng)從組織機(jī)制、業(yè)務(wù)領(lǐng)域及關(guān)鍵技術(shù)三個(gè)方面推進(jìn)。核心業(yè)務(wù)領(lǐng)域包括教育數(shù)據(jù)標(biāo)準(zhǔn)化、教育數(shù)據(jù)的融合共享和教育數(shù)據(jù)隱私保護(hù)。完善這三個(gè)業(yè)務(wù)領(lǐng)域需要兩個(gè)基礎(chǔ)條件:一是建立數(shù)據(jù)治理的組織架構(gòu),科學(xué)的組織機(jī)構(gòu)設(shè)計(jì)和明確的職責(zé)分工是數(shù)

29、據(jù)治理的制度基礎(chǔ);二是依據(jù)技術(shù)規(guī)范和實(shí)施辦法建立數(shù)據(jù)治理平臺(tái),并通過(guò)多種技術(shù)手段和工具實(shí)現(xiàn)對(duì)數(shù)據(jù)的治理。 1. 設(shè)置教育數(shù)據(jù)治理的組織機(jī)構(gòu) 從組織機(jī)構(gòu)來(lái)說(shuō),可以根據(jù)業(yè)務(wù)需要設(shè)置“教育數(shù)據(jù)治理委員會(huì)”及其執(zhí)行機(jī)構(gòu)“教育數(shù)據(jù)治理小組”。按行政層級(jí),可設(shè)置國(guó)家級(jí)、區(qū)域級(jí)和學(xué)校級(jí)的教育數(shù)據(jù)治理委員會(huì);從數(shù)據(jù)來(lái)源考慮,可對(duì)課程教學(xué)數(shù)據(jù)、學(xué)生數(shù)據(jù)、教師數(shù)據(jù)、基礎(chǔ)設(shè)施數(shù)據(jù)等建立專門的業(yè)務(wù)小組。數(shù)據(jù)治理委員會(huì)由各級(jí)領(lǐng)導(dǎo)和管理層組成,職責(zé)如下:制定教育數(shù)據(jù)治理的原則、方針和政策,建立并更新相關(guān)規(guī)章制度,批準(zhǔn)和發(fā)布相關(guān)標(biāo)準(zhǔn)及業(yè)務(wù)指南;實(shí)施和推進(jìn)教育數(shù)據(jù)治理工作。 數(shù)據(jù)治理小組由負(fù)責(zé)具體業(yè)務(wù)的專業(yè)人員組成,可包括數(shù)

30、據(jù)系統(tǒng)管理員、系統(tǒng)開(kāi)發(fā)和維護(hù)人員、業(yè)務(wù)專家和數(shù)據(jù)分析員等角色。小組成員需要鑒別和解決各自業(yè)務(wù)領(lǐng)域內(nèi)的數(shù)據(jù)問(wèn)題,并相互配合協(xié)作。例如,數(shù)據(jù)分析師可以和業(yè)務(wù)專家合作,通過(guò)分析學(xué)生成長(zhǎng)情況的大數(shù)據(jù),及時(shí)監(jiān)控學(xué)生的心理健康和生理健康狀況,從而提出相應(yīng)的決策建議。再如,教學(xué)專家和數(shù)據(jù)分析師合作通過(guò)對(duì)學(xué)生個(gè)體數(shù)據(jù)分析其差異性,設(shè)計(jì)多種個(gè)性化教學(xué)方案。 圖3 教育數(shù)據(jù)治理框架 2. 制定、完善數(shù)據(jù)標(biāo)準(zhǔn)和使用規(guī)范 數(shù)據(jù)標(biāo)準(zhǔn)化是推進(jìn)數(shù)據(jù)治理時(shí)首先需要解決的問(wèn)題。統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)使得教育機(jī)構(gòu)的信息系統(tǒng)建設(shè)有據(jù)可依,不再出現(xiàn)因?yàn)楣?yīng)商不同而使數(shù)據(jù)無(wú)法讀取、共享和交換的情況。數(shù)據(jù)治理委員會(huì)應(yīng)從教育業(yè)務(wù)實(shí)際需求出發(fā),組織

31、完成各類標(biāo)準(zhǔn)的編制,包括技術(shù)標(biāo)準(zhǔn)、業(yè)務(wù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)等(覃炯聰, 2016)。標(biāo)準(zhǔn)的編制既要滿足上級(jí)部門的管理與統(tǒng)計(jì)需求,也要為校內(nèi)外的數(shù)據(jù)交換與共享服務(wù)(李勇軍, 2016)。標(biāo)準(zhǔn)化是一個(gè)長(zhǎng)期、持續(xù)的過(guò)程,在編制新標(biāo)準(zhǔn)時(shí)應(yīng)注意盡量吸納已有國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn),并和已發(fā)布的標(biāo)準(zhǔn)保持一致。 3. 推進(jìn)不同層次和不同維度的數(shù)據(jù)共享 教育主管部門應(yīng)通過(guò)教育數(shù)據(jù)的共享和融合建立起對(duì)教育數(shù)據(jù)的全局把控。各個(gè)學(xué)校也可以此獲得區(qū)域教育發(fā)展水平的各項(xiàng)基準(zhǔn)數(shù)據(jù)作為組織教學(xué)的參考。教育數(shù)據(jù)共享是多層次、多維度的,不僅包括在教育系統(tǒng)內(nèi)的共享,還涉及對(duì)外信息公開(kāi)。為實(shí)現(xiàn)數(shù)據(jù)的整合和共享,需要建立統(tǒng)一的數(shù)據(jù)

32、開(kāi)放平臺(tái)。 在學(xué)校內(nèi)部,可利用統(tǒng)一數(shù)據(jù)平臺(tái)整合各個(gè)二級(jí)單位的管理數(shù)據(jù)、學(xué)生基本信息和行為數(shù)據(jù)、教學(xué)數(shù)據(jù)甚至是后勤管理數(shù)據(jù),這樣既可以提升管理的便捷性和有效性,強(qiáng)化管理,也可以分析教學(xué)過(guò)程的優(yōu)勢(shì)與不足,提升教學(xué)水平。校際之間則可以通過(guò)數(shù)據(jù)整合加強(qiáng)合作,如課程數(shù)據(jù)的共享、學(xué)習(xí)檔案的交換和共享等(王薇娜, 2016)。區(qū)域性的教育數(shù)據(jù)共享也是教育發(fā)展的趨勢(shì)之一。美國(guó)科羅拉多州教育部門開(kāi)發(fā)了全州綜合數(shù)據(jù)系統(tǒng),把178個(gè)學(xué)區(qū)和28所公立高校的學(xué)生數(shù)據(jù)與福利、收入和勞動(dòng)力整合起來(lái),用于分析學(xué)生從幼兒園到大學(xué)的成績(jī)。讓行政官員和任課教師都能夠通過(guò)該系統(tǒng)比較學(xué)生與該州基準(zhǔn)水平的差距,并且能夠分析家庭收入、學(xué)前

33、教育和基礎(chǔ)教育供給水平對(duì)學(xué)生大學(xué)升學(xué)或就業(yè)的影響。 4. 落實(shí)和健全數(shù)據(jù)隱私保護(hù)機(jī)制 大數(shù)據(jù)蘊(yùn)含的巨大價(jià)值得到了業(yè)界的高度關(guān)注,挖掘大數(shù)據(jù)給我們帶來(lái)了巨大價(jià)值。然而,大數(shù)據(jù)在帶來(lái)便利的同時(shí),也會(huì)對(duì)個(gè)人隱私造成巨大風(fēng)險(xiǎn)(黃劉生, 等, 2015)。在教育領(lǐng)域,數(shù)據(jù)保護(hù)措施已經(jīng)落后于實(shí)踐的需要,數(shù)據(jù)隱私尚未得到廣泛的重視,缺乏合理、可行的措施和懲處機(jī)制。結(jié)合其他行業(yè)的成熟經(jīng)驗(yàn),數(shù)據(jù)隱私保護(hù)機(jī)制應(yīng)包括以下內(nèi)容:隱私風(fēng)險(xiǎn)主動(dòng)監(jiān)測(cè),在處理大數(shù)據(jù)時(shí)要主動(dòng)監(jiān)測(cè)那些不正當(dāng)?shù)幕蛘哂袗阂獾牟僮鳎浑[私風(fēng)險(xiǎn)主動(dòng)評(píng)估,能夠主動(dòng)分析出隱私風(fēng)險(xiǎn)大小,并選擇合理的隱私保護(hù)技術(shù);問(wèn)責(zé)機(jī)制,當(dāng)某個(gè)實(shí)體的行為違反了策略和規(guī)則時(shí)應(yīng)當(dāng)

34、受到規(guī)定的懲罰(孟小峰, 等, 2015)。 5. 建設(shè)數(shù)據(jù)治理的技術(shù)平臺(tái) 數(shù)據(jù)治理工作的落實(shí)依賴于信息技術(shù)平臺(tái)。各級(jí)教育部門的數(shù)據(jù)治理平臺(tái)建設(shè)應(yīng)以已有的信息系統(tǒng)為基礎(chǔ),引入業(yè)界的先進(jìn)技術(shù)和經(jīng)驗(yàn)。從滿足功能應(yīng)用出發(fā),以數(shù)據(jù)架構(gòu)為基礎(chǔ),加強(qiáng)數(shù)據(jù)庫(kù)設(shè)計(jì),建立區(qū)域級(jí)的數(shù)據(jù)中心,搭建數(shù)據(jù)質(zhì)量監(jiān)控平臺(tái),實(shí)施數(shù)據(jù)安全工作(高亮, 2014)。數(shù)據(jù)中心可以集聚零散數(shù)據(jù)、形成教育數(shù)據(jù)資源,然后基于先進(jìn)的分析軟件深度挖掘其中的價(jià)值;應(yīng)能夠直接與各單位自有的數(shù)據(jù)平臺(tái)無(wú)縫連接,直接匯總各單位的原始數(shù)據(jù);應(yīng)包括數(shù)挖掘和分析及評(píng)估管理信息系統(tǒng),對(duì)數(shù)據(jù)挖掘分析的統(tǒng)計(jì)結(jié)果,并通過(guò)長(zhǎng)期的數(shù)據(jù)分析,對(duì)教育現(xiàn)狀輔助評(píng)估(許曉東,

35、 等, 2015)。 (二)教育數(shù)據(jù)治理的案例 1. 新南威爾士大學(xué)的數(shù)據(jù)治理項(xiàng)目 新南威爾士大學(xué),作為澳大利亞名校聯(lián)盟“八大名?!敝?,是一所世界知名的研究型大學(xué)。為了改善數(shù)據(jù)資產(chǎn)管理,降低運(yùn)營(yíng)和管理風(fēng)險(xiǎn),該校于2017年發(fā)起了“數(shù)據(jù)治理”項(xiàng)目。這個(gè)項(xiàng)目對(duì)該校的數(shù)據(jù)政策和治理組織進(jìn)行了規(guī)劃和實(shí)踐,制定了包括人員分配、職責(zé)規(guī)定、數(shù)據(jù)整合規(guī)范、數(shù)據(jù)分類和數(shù)據(jù)隱私保護(hù)方法等一系列數(shù)據(jù)治理政策,奠定了該校實(shí)現(xiàn)數(shù)據(jù)整合、保護(hù)數(shù)據(jù)安全、改善數(shù)據(jù)質(zhì)量以及提高數(shù)據(jù)使用效率的指導(dǎo)原則。該項(xiàng)目建立了一個(gè)較為完整的數(shù)據(jù)治理組織架構(gòu),描述了相關(guān)的角色及其職責(zé)(UNSW, 2017),如圖4所示。 該項(xiàng)目確立了數(shù)據(jù)治

36、理指導(dǎo)委員作為最高管理機(jī)構(gòu),負(fù)責(zé)指導(dǎo)項(xiàng)目決策,制定原則和標(biāo)準(zhǔn)。數(shù)據(jù)治理執(zhí)行委員會(huì)是該指導(dǎo)委員會(huì)的執(zhí)行部門,監(jiān)督各項(xiàng)政策和規(guī)則的貫徹實(shí)施,并保障項(xiàng)目執(zhí)行過(guò)程和數(shù)據(jù)管理生命周期一致,同時(shí)負(fù)責(zé)檢查數(shù)據(jù)質(zhì)量,為問(wèn)題解決提供操作性指導(dǎo)。各部門的數(shù)據(jù)專員負(fù)責(zé)各自部門的數(shù)據(jù)質(zhì)量、數(shù)據(jù)整合及數(shù)據(jù)管理的實(shí)施執(zhí)行,監(jiān)督數(shù)據(jù)使用者的身份,識(shí)別和修復(fù)各自部門的數(shù)據(jù)問(wèn)題。業(yè)務(wù)專家包括數(shù)據(jù)庫(kù)管理員、系統(tǒng)管理員、業(yè)務(wù)領(lǐng)域?qū)<?、軟件開(kāi)發(fā)人員和業(yè)務(wù)分析師等,他們?yōu)閷W(xué)校數(shù)據(jù)信息治理的各項(xiàng)業(yè)務(wù)提供一線的支持和幫助。 新南威爾士大學(xué)的數(shù)據(jù)治理項(xiàng)目建立了體系完善的數(shù)據(jù)治理組織架構(gòu),自上而下的管理層級(jí)保證了數(shù)據(jù)治理工作的推進(jìn)有執(zhí)行力,在

37、整個(gè)體系中吸收了各類人員的參與保證了具體的業(yè)務(wù)問(wèn)題能夠得到關(guān)注和解決。該案例中有三點(diǎn)具體經(jīng)驗(yàn)特別值得我們借鑒:確立了數(shù)據(jù)治理的制度和流程,將過(guò)程和規(guī)則制度化,設(shè)定了清晰的邊界,使得各項(xiàng)和數(shù)據(jù)相關(guān)的業(yè)務(wù)有了清楚的依據(jù),并且以此為基礎(chǔ)優(yōu)化了數(shù)據(jù)治理的各項(xiàng)環(huán)節(jié)。明確了整個(gè)數(shù)據(jù)治理工作的組織架構(gòu),以及各個(gè)層級(jí)和各類人員的職能和責(zé)任,在組織架構(gòu)層面以制度為保證,較好地支持了數(shù)據(jù)治理工作,使得各類數(shù)據(jù)項(xiàng)目能夠有序執(zhí)行。同時(shí),在出現(xiàn)數(shù)據(jù)問(wèn)題時(shí)也可以精確地找到責(zé)任人員,改善了原來(lái)數(shù)據(jù)管理工作中各個(gè)崗位工作職責(zé)不清的問(wèn)題。建立了業(yè)務(wù)操作人員、技術(shù)專家和管理人員的協(xié)同和會(huì)商機(jī)制。數(shù)據(jù)治理工作往往是全局性的,某項(xiàng)數(shù)

38、據(jù)管理和使用會(huì)涉及多個(gè)部門的多個(gè)崗位,這種協(xié)同機(jī)制使得治理業(yè)務(wù)中暴露出來(lái)的問(wèn)題能夠得到所有相關(guān)方的關(guān)注,并及時(shí)地識(shí)別、定位和解決。 2. 美國(guó)堪薩斯州的數(shù)據(jù)治理項(xiàng)目 教育數(shù)據(jù)交換網(wǎng)絡(luò)(Education Data Exchange Network, EDEN)是美國(guó)學(xué)校、州教育部門及聯(lián)邦教育部門進(jìn)行數(shù)據(jù)報(bào)送和交換的信息系統(tǒng)。長(zhǎng)期以來(lái),美國(guó)堪薩斯州教育部門在向EDEN提交數(shù)據(jù)時(shí)飽受各種問(wèn)題困擾,如數(shù)據(jù)不連續(xù)、數(shù)據(jù)質(zhì)量差、數(shù)據(jù)缺乏一致性、數(shù)據(jù)格式多樣等。解決這些問(wèn)題需要花費(fèi)大量的時(shí)間,且效果不理想。為了改善這種狀況,他們意識(shí)到對(duì)數(shù)據(jù)進(jìn)行治理的重要性,因此發(fā)起了一項(xiàng)數(shù)據(jù)治理項(xiàng)目(Kathy, 200

39、7),通過(guò)近十年的努力逐步建立了州教育數(shù)據(jù)治理的流程和規(guī)范,用于保障教育數(shù)據(jù)的質(zhì)量。 在整個(gè)數(shù)據(jù)治理流程中,數(shù)據(jù)部門進(jìn)行數(shù)據(jù)匯總和上報(bào)EDEN的主要業(yè)務(wù)流程和關(guān)鍵節(jié)點(diǎn)如圖5所示。整個(gè)過(guò)程可分為兩步:第一步,從數(shù)據(jù)源采集原始數(shù)據(jù),根據(jù)元數(shù)據(jù)倉(cāng)庫(kù)定義的轉(zhuǎn)換規(guī)則將從數(shù)據(jù)源采集到的數(shù)據(jù)轉(zhuǎn)換為滿足EDEN格式的數(shù)據(jù),并存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù);第二步,到數(shù)據(jù)倉(cāng)庫(kù)提取數(shù)據(jù)并生成向EDEN提交的文件,并將文件提交到EDEN數(shù)據(jù)系統(tǒng)。數(shù)據(jù)治理工作涉及四個(gè)角色的技術(shù)人員: ? EDEN協(xié)調(diào)員。負(fù)責(zé)從EDEN數(shù)據(jù)庫(kù)下載文件規(guī)范,并依據(jù)文件規(guī)范建立元數(shù)據(jù)庫(kù)。 ? 數(shù)據(jù)管理員。根據(jù)元數(shù)據(jù)倉(cāng)庫(kù)制定數(shù)據(jù)從數(shù)據(jù)源倉(cāng)庫(kù)下載存儲(chǔ)到數(shù)據(jù)倉(cāng)

40、庫(kù)時(shí)的轉(zhuǎn)換規(guī)則,檢查數(shù)據(jù)質(zhì)量。 ? 數(shù)據(jù)倉(cāng)庫(kù)(ETL)程序員。根據(jù)數(shù)據(jù)管理者制定的數(shù)據(jù)轉(zhuǎn)換規(guī)則將數(shù)據(jù)從數(shù)據(jù)源系統(tǒng)抽取出來(lái),并以EDEN存儲(chǔ)格式存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)。 ? XML程序員。負(fù)責(zé)將單純的數(shù)據(jù)轉(zhuǎn)換為向EDEN提交的文件,并將文件提交到EDEN數(shù)據(jù)庫(kù)。 在這個(gè)過(guò)程中,堪薩斯州的教育數(shù)據(jù)管理部門依據(jù)EDEN的數(shù)據(jù)文件規(guī)范,制定統(tǒng)一的數(shù)據(jù)采集和轉(zhuǎn)換規(guī)則,保障數(shù)據(jù)的一致性和標(biāo)準(zhǔn)化。同時(shí),教育部門的數(shù)據(jù)委員會(huì)還定期評(píng)估數(shù)據(jù)質(zhì)量。數(shù)據(jù)治理工作不僅需要建立各種基礎(chǔ)設(shè)施,如數(shù)據(jù)源采集系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、元數(shù)據(jù)倉(cāng)庫(kù)等,還要建立和維護(hù)項(xiàng)目文檔,包括EDEN提交計(jì)劃文檔、項(xiàng)目分解計(jì)劃文檔、通信文檔、角色職責(zé)分配文檔等

41、。為了保證良好的工作溝通還要開(kāi)展工作交流會(huì),包括數(shù)據(jù)治理委員會(huì)會(huì)議、數(shù)據(jù)管理會(huì)議及EDEN現(xiàn)狀核心小組會(huì)議等。 該案例具體介紹了堪薩斯州教育部門在數(shù)據(jù)管理和治理方面的經(jīng)驗(yàn)。主要有三個(gè)亮點(diǎn)可供我們參考:數(shù)據(jù)治理的技術(shù)平臺(tái)和業(yè)務(wù)過(guò)程。其中涉及了數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)、外部數(shù)據(jù)庫(kù)等各種系統(tǒng),以及數(shù)據(jù)元描述,數(shù)據(jù)格式規(guī)范、轉(zhuǎn)換規(guī)則等技術(shù)規(guī)格。技術(shù)人員的崗位職責(zé)。數(shù)據(jù)治理過(guò)程涉及數(shù)據(jù)管理員、程序員和協(xié)調(diào)人等不同的角色,他們的工作具有很強(qiáng)的專業(yè)性,相互銜接,各司其職,以保障整個(gè)治理工作得以有序進(jìn)行。有序迭代的數(shù)據(jù)治理方案。該州的數(shù)據(jù)治理工作是逐年完善的,從一較小的滿足EDEN數(shù)據(jù)提交的需求開(kāi)始,經(jīng)歷了多次迭代,直到實(shí)現(xiàn)全州教育數(shù)據(jù)的統(tǒng)合。在歷次迭代中,數(shù)據(jù)治理覆蓋的范圍逐步擴(kuò)大,涉及的人群和相關(guān)方也逐漸增加。通過(guò)持續(xù)的數(shù)據(jù)治理,堪薩斯州教育部門的數(shù)據(jù)管理水平有了顯著提升,在提高工作效率的同時(shí)減輕了工作人員的負(fù)擔(dān),較好地保證了數(shù)據(jù)的質(zhì)量和數(shù)據(jù)的一致性,實(shí)現(xiàn)了數(shù)據(jù)共享,數(shù)據(jù)安全性也得到了極大保障。 五、總結(jié) 大數(shù)據(jù)在教育領(lǐng)域內(nèi)有著廣泛的應(yīng)用前景和不可替代的作用。然而,傳統(tǒng)的數(shù)據(jù)分析、管理和利用方法在大數(shù)據(jù)時(shí)代不再適用,其局限性日益顯著。數(shù)據(jù)治理已經(jīng)成為教育數(shù)據(jù)管理中亟須解決的問(wèn)題。對(duì)教育數(shù)據(jù)進(jìn)行合理、有效的治理,對(duì)于教育發(fā)展和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論