下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)加工處理數(shù)據(jù)加工實(shí)現(xiàn)方法數(shù)據(jù)加工是將源端采集的各個(gè)委辦局?jǐn)?shù)據(jù)加工為可進(jìn)行數(shù)據(jù)開放的數(shù)據(jù),對(duì)加工過程中的錯(cuò)誤數(shù)據(jù)、冗余數(shù)據(jù)進(jìn)行問題追溯、對(duì)加工過程中的數(shù)據(jù)質(zhì)量問題進(jìn)行管理,保證數(shù)據(jù)加工的可視化、保證數(shù)據(jù)質(zhì)量的準(zhǔn)確化。數(shù)據(jù)加工處理,是整個(gè)數(shù)據(jù)應(yīng)用的前置環(huán)節(jié),其結(jié)果質(zhì)量直接關(guān)系到模型效果和最終結(jié)論。在實(shí)際操作中,加工處理的方式包括:1、數(shù)據(jù)生產(chǎn)計(jì)劃:數(shù)據(jù)需求和數(shù)據(jù)處理設(shè)計(jì)的子模塊,主要功能為:數(shù)據(jù)的語義化、加工能力的組件化,負(fù)責(zé)銜接業(yè)務(wù)和技術(shù),是信息的樞紐,也是知識(shí)庫的堅(jiān)實(shí)基礎(chǔ)。2、數(shù)據(jù)生產(chǎn)執(zhí)行:執(zhí)行數(shù)據(jù)處理的子模塊,融合了庫外ETL、庫內(nèi)數(shù)據(jù)加工、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量檢查、調(diào)度管理等孤立系統(tǒng)的必要功能,負(fù)責(zé)數(shù)據(jù)生產(chǎn)計(jì)劃的執(zhí)行、數(shù)據(jù)的生產(chǎn)和數(shù)據(jù)質(zhì)量控制等工作。3、 數(shù)據(jù)生產(chǎn)管理:數(shù)據(jù)處理日常監(jiān)控和綜合管理的子模塊,負(fù)責(zé)數(shù)據(jù)處理和數(shù)據(jù)規(guī)范的管控。數(shù)據(jù)生產(chǎn)管理橫煥數(shù)據(jù)生產(chǎn)池J數(shù)據(jù)生產(chǎn)管理橫煥各類組件,以業(yè)務(wù)驅(qū)曲定制,供數(shù)據(jù)分析師使用+rfe制定規(guī)苑+rfe回『會(huì)折案類分析數(shù)據(jù)分美神經(jīng)網(wǎng)鏘I7M術(shù)人員 弋尸算法噗型數(shù)據(jù)分析炳管控泣程就洲i數(shù)據(jù)加工實(shí)現(xiàn)回『會(huì)折案類分析數(shù)據(jù)分美神經(jīng)網(wǎng)鏘I7M術(shù)人員 弋尸算法噗型數(shù)據(jù)分析炳管控泣程就洲i數(shù)據(jù)加工實(shí)現(xiàn)目目目目管控開發(fā)數(shù)據(jù)加工效果評(píng)估數(shù)據(jù)準(zhǔn)確是數(shù)據(jù)共享開放的前提,一方面要求業(yè)務(wù)需求和技術(shù)實(shí)現(xiàn)的一致性,另外一方面要求數(shù)據(jù)加工生產(chǎn)過程正確性,在數(shù)據(jù)治理過程中通過事前設(shè)計(jì)、事中管控、事后稽核的方式確保數(shù)據(jù)輸出的質(zhì)量正確。1、 事前設(shè)計(jì)數(shù)據(jù)加工前期,需要對(duì)數(shù)據(jù)加工過程進(jìn)行詳細(xì)的設(shè)計(jì),對(duì)數(shù)據(jù)加工的方法,數(shù)據(jù)的詳細(xì)字段,數(shù)據(jù)的語義語法、存儲(chǔ)方法、存儲(chǔ)位置、分層規(guī)則、命名規(guī)則、標(biāo)準(zhǔn)規(guī)則、存儲(chǔ)規(guī)則等進(jìn)行詳細(xì)的設(shè)計(jì)、論證、驗(yàn)證。數(shù)據(jù)加工處理時(shí),嚴(yán)格按照前期的設(shè)計(jì)進(jìn)行。2、 事中控制數(shù)據(jù)加工在處理過程中,可以通過一定的方法來保證數(shù)據(jù)加工處理的過程嚴(yán)格按照預(yù)先設(shè)計(jì)的規(guī)則、方法進(jìn)行,以保證數(shù)據(jù)加工處理的過程不出現(xiàn)問題,從而保證數(shù)據(jù)的最終質(zhì)量。方法包括但不限于:(1) 目標(biāo)表加工邏輯的可視化:將處理邏輯可視化展示在平臺(tái)上,且管理的處理邏輯和生產(chǎn)的處理邏輯一致,則可支撐業(yè)務(wù)需求和技術(shù)實(shí)現(xiàn)一致性復(fù)查。(2) 目標(biāo)表加工鏈路的可視化:將目標(biāo)表的加工鏈路可視化進(jìn)行管理,通過調(diào)度圖(血緣圖)可了解整個(gè)目標(biāo)表的生成過程,則可支撐業(yè)務(wù)流程和技術(shù)實(shí)現(xiàn)流程一致性人工復(fù)查。(3) 由平臺(tái)保證開發(fā)人員按照指定的要求進(jìn)行開發(fā),統(tǒng)一建模標(biāo)準(zhǔn),降低理解門檻。3、 事后評(píng)估數(shù)據(jù)加工處理完成后,需要對(duì)數(shù)據(jù)的質(zhì)量進(jìn)行評(píng)估,通過一定的測(cè)試方法,來驗(yàn)證數(shù)據(jù)處理的質(zhì)量。形成整體評(píng)估報(bào)告,以確定數(shù)據(jù)處理的質(zhì)量,如數(shù)據(jù)質(zhì)量達(dá)不到要求,需要重新審視整個(gè)加工處理過程,包括前期的設(shè)計(jì),找出問題所在,優(yōu)化處理方案,進(jìn)行重新加工,直至數(shù)據(jù)質(zhì)量達(dá)到要求。數(shù)據(jù)質(zhì)量評(píng)估包括但不限于以下內(nèi)容:對(duì)模型字段進(jìn)行檢查校驗(yàn),對(duì)各層模型數(shù)據(jù)引用規(guī)范進(jìn)行檢查,對(duì)各層模型元素命名規(guī)則進(jìn)行檢查,對(duì)模型表字段進(jìn)行檢查校驗(yàn),對(duì)數(shù)據(jù)存儲(chǔ)規(guī)范進(jìn)行檢驗(yàn)等。數(shù)據(jù)加工后存儲(chǔ)與交互數(shù)據(jù)加工平臺(tái)的數(shù)據(jù)分為操作數(shù)據(jù)、元數(shù)據(jù)、血緣、調(diào)度數(shù)據(jù),數(shù)據(jù)加工平臺(tái)的數(shù)據(jù)關(guān)系如下:而函標(biāo) 'i I 頑而B百TOC\o"1-5"\h\z數(shù)據(jù)爰源詈理平臺(tái) ] 1誠4血^ I I 政據(jù)加工平臺(tái)〈應(yīng)用和85根庫}散據(jù)加工平臺(tái)[對(duì)外眼勞) ?― 諛睹.帽.at—1 : 割照!卜理蓉R―T—— ; .__大數(shù)據(jù)登源池?fù)Q犧擇 II | 基她座 主題座\o"CurrentDocument" 1 1I |安全平臺(tái) 1數(shù)據(jù)加工平臺(tái)數(shù)據(jù)存儲(chǔ)與交互數(shù)據(jù)加工平臺(tái)和外圍系統(tǒng)的數(shù)據(jù)交互需統(tǒng)一由對(duì)外服務(wù)模塊提供,和基礎(chǔ)平臺(tái)的交互由數(shù)據(jù)加工平臺(tái)應(yīng)用直接交互。由應(yīng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 長期機(jī)械租賃合同范本
- 兒子撫養(yǎng)的離婚協(xié)議書案例
- 企業(yè)貸款擔(dān)保合同風(fēng)險(xiǎn)評(píng)估
- 2024年學(xué)校聘用臨時(shí)工協(xié)議書模板
- 廣告制作合同示例
- 家具交易合同樣本
- 2024年公司合作條款示范文本
- 工程施工居間合同范本
- 股權(quán)合作協(xié)議書撰寫心得
- 高端家具銷售合同格式
- 各省中國鐵路限公司2024招聘(目前38183人)高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 杭州本級(jí)公共租賃住房資格續(xù)審申請(qǐng)表Ⅴ
- 建筑垃圾外運(yùn)施工方案
- 上海市青浦區(qū)上海五浦匯實(shí)驗(yàn)學(xué)校 2024-2025學(xué)年上學(xué)期六年級(jí)數(shù)學(xué)期中試卷(無答案)
- 體育賽事組織與執(zhí)行手冊(cè)
- 2024年擴(kuò)大“司機(jī)之家”覆蓋范圍工作策劃方案
- 課內(nèi)閱讀(專項(xiàng)訓(xùn)練)-2024-2025學(xué)年統(tǒng)編版語文四年級(jí)上冊(cè)
- 蘇教版數(shù)學(xué)五年級(jí)上冊(cè)《解決問題的策略》
- 義務(wù)教育語文課程標(biāo)準(zhǔn)(2022年版)考試題庫及答案1
- 2024二十屆三中全會(huì)知識(shí)競賽題庫及答案
- 2024光伏電站質(zhì)量驗(yàn)收項(xiàng)目劃分表(分部分項(xiàng))
評(píng)論
0/150
提交評(píng)論