數(shù)據(jù)質(zhì)量管理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告_第1頁
數(shù)據(jù)質(zhì)量管理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告_第2頁
數(shù)據(jù)質(zhì)量管理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告_第3頁
數(shù)據(jù)質(zhì)量管理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告_第4頁
數(shù)據(jù)質(zhì)量管理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)質(zhì)量治理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告數(shù)據(jù)質(zhì)量治理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告制訂數(shù)據(jù)標(biāo)準(zhǔn)、標(biāo)準(zhǔn)流程同樣重要。:銷售人們可以把上述各種在不同時(shí)期由于不同目的而生成的數(shù)據(jù)進(jìn)展5個(gè)方面著手。義?!脖确匠鲇诒憷?、習(xí)慣等〕訂的。相對而言,前者更簡潔執(zhí)行一些。數(shù)據(jù)治理面臨的兩個(gè)主要挑戰(zhàn)是企業(yè)本身的簡單性和身份信息數(shù)據(jù)質(zhì)量指標(biāo)時(shí),必需保證這些措施和指標(biāo)能夠不斷重復(fù)。在數(shù)據(jù)轉(zhuǎn)化流程中設(shè)立多共性能監(jiān)控點(diǎn)。數(shù)據(jù)的質(zhì)量凹凸著工程的最終成功。對流程不斷進(jìn)展改善和優(yōu)化。我們常常聽到有人說,他們覺察這些方法本錢昂揚(yáng)的時(shí)候,就應(yīng)當(dāng)考慮換一種方式了。把責(zé)任落實(shí)到人。通常,我們認(rèn)為那些與數(shù)據(jù)的產(chǎn)生、維會針對具體狀況適時(shí)調(diào)整數(shù)據(jù)質(zhì)量的目標(biāo)。5點(diǎn)有助于幫助組織標(biāo)準(zhǔn)數(shù)據(jù)質(zhì)量治理中與人有關(guān)的流程。提高數(shù)據(jù)質(zhì)量的三個(gè)步驟此過程包括數(shù)據(jù)質(zhì)量評估、規(guī)劃以及策略的選擇和實(shí)施。IT機(jī)構(gòu)節(jié)約工程本錢。就遵循數(shù)據(jù)質(zhì)量規(guī)章。生的影響。目前的策略類型有兩種:在企業(yè)輸入數(shù)據(jù)時(shí)提高數(shù)據(jù)質(zhì)量的方法稱為“上游”方法,而從運(yùn)營系統(tǒng)提取數(shù)據(jù)的應(yīng)用程序〔如數(shù)據(jù)倉庫〕中改善數(shù)據(jù)質(zhì)量的方法是“下游”方法。數(shù)據(jù)質(zhì)量功能?!捕菙?shù)據(jù)源中的〔尤其是數(shù)據(jù)轉(zhuǎn)換、名稱和地址清洗以及查找驗(yàn)證〕數(shù)據(jù)質(zhì)量治理5要素?cái)?shù)據(jù)質(zhì)量報(bào)告業(yè)在任何時(shí)候都可以信任滿足全部需求的全部數(shù)據(jù)。一個(gè)戰(zhàn)略性和系統(tǒng)性的方法能幫助企業(yè)正確爭論企業(yè)的數(shù)IT部門的相關(guān)人員將各自具有明確角數(shù)據(jù)質(zhì)量反映的是數(shù)據(jù)的“〔fitnessforuse〕”,即數(shù)據(jù)治理的前提。數(shù)據(jù)質(zhì)量問題的影響因素1、數(shù)據(jù)質(zhì)量方面緣由——數(shù)據(jù)不全都根底數(shù)據(jù)難以共享利用,數(shù)據(jù)的深層價(jià)值也難以表達(dá)。2、數(shù)據(jù)質(zhì)量方面緣由——數(shù)據(jù)不完整性信息,數(shù)據(jù)完整性無法得到保障。3、數(shù)據(jù)質(zhì)量方面緣由——數(shù)據(jù)不合規(guī)利用,且沒有相應(yīng)的數(shù)據(jù)治理流程。4、數(shù)據(jù)質(zhì)量方面緣由——數(shù)據(jù)不行控標(biāo)準(zhǔn)、制度、流程得到長效執(zhí)行。5、數(shù)據(jù)質(zhì)量方面緣由——數(shù)據(jù)冗余成了企業(yè)頂層視角的數(shù)據(jù)消滅“一物多碼”、“一碼多物”等現(xiàn)象。5個(gè)因素.中琛魔方大數(shù)據(jù)平臺治理。常見的數(shù)據(jù)質(zhì)量問題包括數(shù)據(jù)不全都實(shí)效性不強(qiáng)精度不夠數(shù)據(jù)質(zhì)量治理的目標(biāo)通過數(shù)據(jù)分析、數(shù)據(jù)評估、數(shù)據(jù)清洗、數(shù)據(jù)監(jiān)控、錯(cuò)誤預(yù)警數(shù)據(jù)需求方對數(shù)據(jù)質(zhì)量的規(guī)章要求。數(shù)據(jù)質(zhì)量評估包括但不止以下6個(gè)方面完整性Completeness:度量哪些數(shù)據(jù)喪失了或者哪些數(shù)據(jù)不行用。標(biāo)準(zhǔn)性Conformity:度量哪些數(shù)據(jù)未按統(tǒng)一格式存儲。全都性Consistency:度量哪些數(shù)據(jù)的值在信息含義上是沖突的。準(zhǔn)確性Accuracy據(jù)是超期的。s些屬性是重復(fù)的。關(guān)聯(lián)性Integration:度量哪些關(guān)聯(lián)的數(shù)據(jù)缺失或者未建立索引。數(shù)據(jù)質(zhì)量評估模型要素分別為:型、數(shù)據(jù)質(zhì)量評價(jià)模型、數(shù)據(jù)質(zhì)量關(guān)心模型。根底模型。主要是映射、定義數(shù)據(jù)采集標(biāo)準(zhǔn),上載分單位的采集打算,同時(shí)納入了約束規(guī)章定義標(biāo)準(zhǔn)、掌握規(guī)章定義標(biāo)準(zhǔn)、模板定義標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)準(zhǔn):分兩局部,一局部是直接映射應(yīng)用中的標(biāo)準(zhǔn),例如源數(shù)據(jù)庫標(biāo)準(zhǔn);另一局部是針對增應(yīng)用庫和工程庫標(biāo)準(zhǔn)的定義標(biāo)準(zhǔn),包括代碼定義標(biāo)準(zhǔn)、數(shù)據(jù)項(xiàng)定義標(biāo)準(zhǔn)(例如是取英文還是漢語拼音,取幾個(gè)字符、值域定義標(biāo)準(zhǔn)等等增表準(zhǔn)的建立標(biāo)準(zhǔn);采集打算:劃;約束規(guī)章定義標(biāo)準(zhǔn):主要描述質(zhì)量定義模型中的語法構(gòu)成;掌握規(guī)章定義標(biāo)準(zhǔn):針對效勞器負(fù)載和采集表的準(zhǔn)時(shí)性,要求建立的后臺執(zhí)行過程的掌握方式的使用說明;數(shù)據(jù)質(zhì)量定義模型。以根底模型為前提對數(shù)據(jù)質(zhì)量的統(tǒng)一標(biāo)準(zhǔn)的定義,是數(shù)據(jù)質(zhì)4個(gè)關(guān)鍵特性。(1全都性的量化評價(jià)指標(biāo):間記錄全都率。(2準(zhǔn)確性的量化評價(jià)指標(biāo):準(zhǔn)確率、過失率a、問題字段個(gè)數(shù)、問題記錄掩蓋率(3)準(zhǔn)時(shí)性的量化評價(jià)指標(biāo):采集工程準(zhǔn)時(shí)率;單位入庫準(zhǔn)時(shí)率(4)完整性的量化評價(jià)指標(biāo):字段缺失數(shù)、缺失記錄掩蓋率、打算完成率。數(shù)據(jù)質(zhì)量掌握模型。據(jù)質(zhì)量掌握模型的掌握內(nèi)容表現(xiàn)在:對數(shù)據(jù)檢查對象、數(shù)據(jù)檢查頻度、數(shù)據(jù)檢查時(shí)間、數(shù)據(jù)檢查方式等方面進(jìn)展掌握。數(shù)據(jù)檢查對象:是指依據(jù)采集打算設(shè)定需要檢查的用戶、專業(yè)數(shù)據(jù)表、數(shù)據(jù)庫實(shí)體。數(shù)據(jù)檢查頻度;是指依據(jù)數(shù)據(jù)表的采集打算和實(shí)際發(fā)生的頻度,設(shè)定存儲過程的檢查執(zhí)行頻率。數(shù)據(jù)檢查時(shí)間:是指依據(jù)每日生產(chǎn)應(yīng)用的密集時(shí)間以及數(shù)據(jù)發(fā)生到采集入庫的密集時(shí)間,綜合設(shè)定一個(gè)檢查開頭執(zhí)行的時(shí)刻。數(shù)據(jù)檢查方式:是指執(zhí)行檢查過程的方式可以由后臺過程2小時(shí)自動檢查一次;也可以由人工干預(yù)手動〔固然盡量選擇數(shù)據(jù)庫流量比較低的時(shí)候。數(shù)據(jù)質(zhì)量評價(jià)模型。據(jù)質(zhì)量的關(guān)鍵指標(biāo),實(shí)現(xiàn)對數(shù)據(jù)質(zhì)量的量化診斷和評價(jià)。數(shù)據(jù)質(zhì)量分析評價(jià)模型功能核心是,通過對根底模型中的采集打算和質(zhì)量定義模型中的約束規(guī)章的處理,由掌握模型調(diào)用可以實(shí)現(xiàn)檢查分析的后臺存儲過程在實(shí)體庫中執(zhí)行檢查,形成查詢,生成反映采集打算完成狀況和數(shù)據(jù)質(zhì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論