版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、云平臺數(shù)據(jù)治理項(xiàng)目技術(shù)方案第1章整體方案41.1 項(xiàng)目需求理解方案 41.1.1 項(xiàng)目背景41.1.2 項(xiàng)目概述41.1.2.1 項(xiàng)目現(xiàn)狀41.1.2.2 項(xiàng)目目標(biāo)61.1.2.3 項(xiàng)目內(nèi)容71.2 總體設(shè)計(jì)方案 81.2.1 總體定位及目標(biāo) 81.2.2 設(shè)計(jì)原則及約束91.2.2.1 總體設(shè)計(jì)原則 91.2.2.2 總體設(shè)計(jì)約束 101.2.3 總體應(yīng)用架構(gòu)設(shè)計(jì) 111.2.4 總體數(shù)據(jù)架構(gòu)設(shè)計(jì) 121.2.4.1 數(shù)據(jù)框架設(shè)計(jì) 131.2.4.2 數(shù)據(jù)框架細(xì)化設(shè)計(jì) 141.3 數(shù)據(jù)治理方案 161.3.1 概述161.3.2 數(shù)據(jù)管理制度與機(jī)制 161.3.3 數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范建設(shè) 171
2、.3.3.1 一致性維度標(biāo)準(zhǔn) 191.3.3.2 基礎(chǔ)數(shù)據(jù)項(xiàng)體系標(biāo)準(zhǔn) 191.3.4 元數(shù)據(jù)管理221.3.4.1 元數(shù)據(jù)管理總體分析 221.3.4.2 元數(shù)據(jù)管理設(shè)計(jì)271.3.5 數(shù)據(jù)質(zhì)量管理301.3.5.1 數(shù)據(jù)質(zhì)量管理總體分析 311.3.5.2 數(shù)據(jù)質(zhì)量管理設(shè)計(jì) 321.3.6 數(shù)據(jù)生命周期管理 351.3.6.1 數(shù)據(jù)生命周期總體分析 361.3.6.2 數(shù)據(jù)生命周期管理設(shè)計(jì) 411.3.7 數(shù)據(jù)歸集 441.3.7.1 數(shù)據(jù)歸集流程設(shè)計(jì)441.3.7.2 數(shù)據(jù)歸集方法設(shè)計(jì) 451.3.8 數(shù)據(jù)資產(chǎn)管理 461.3.8.1 數(shù)據(jù)資產(chǎn)分類471.3.8.2 數(shù)據(jù)資產(chǎn)盤點(diǎn)471.3
3、.8.3 數(shù)據(jù)質(zhì)量評估471.3.8.4 數(shù)據(jù)資產(chǎn)使用情況監(jiān)控 471.3.9 數(shù)據(jù)安全管理 481.3.9.1 安全管控機(jī)制建設(shè) 481.3.9.2 數(shù)據(jù)訪問權(quán)限管理491.3.9.3 數(shù)據(jù)分級分類管理 491.3.9.4 數(shù)據(jù)脫敏管理491.3.9.5 數(shù)據(jù)安全審計(jì)49第1章整體方案1.1 項(xiàng)目需求理解方案1.1.1 項(xiàng)目背景云平臺數(shù)據(jù)管理項(xiàng)目基于大數(shù)據(jù)技術(shù)和理念,以云平臺為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全面豐 富的決策和參考支持,構(gòu)建開放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。項(xiàng)目自開工建設(shè)以來, 始終以“用數(shù)據(jù)服務(wù)征管方式轉(zhuǎn)變”為建設(shè)主線,在大數(shù)據(jù)算法
4、應(yīng)用、海量用戶 支持、關(guān)系云圖、風(fēng)險(xiǎn)動(dòng)態(tài)積分、用戶畫像等方面進(jìn)行了積極探索、實(shí)踐,出色 完成了設(shè)定任務(wù),達(dá)到了預(yù)期效果。目前,云平臺數(shù)據(jù)管理項(xiàng)目已從驗(yàn)證階段轉(zhuǎn) 為生產(chǎn)應(yīng)用階段,實(shí)現(xiàn)了以數(shù)據(jù)為中心,以技術(shù)基礎(chǔ)平臺為依托,以分析類應(yīng)用 實(shí)現(xiàn)為目標(biāo),涵蓋數(shù)據(jù)“采、存、通、用”全生命周期的一體化生態(tài)系統(tǒng),是大 數(shù)據(jù)、互聯(lián)網(wǎng)+、云計(jì)算等理念、方法論、技術(shù)手段和解決方案的集成展現(xiàn)。在云平臺數(shù)據(jù)管理項(xiàng)目建設(shè)完成的基礎(chǔ)上, 總局云平臺數(shù)據(jù)管理升級完善及 運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)工作的主要任務(wù)是: 以云平臺數(shù)據(jù)管理項(xiàng)目建設(shè)內(nèi)容為 基礎(chǔ),做好現(xiàn)有硬、軟件運(yùn)行維護(hù)與優(yōu)化升級;進(jìn)一步拓寬數(shù)據(jù)集成范圍、拓展 數(shù)據(jù)應(yīng)用、深
5、度挖掘數(shù)據(jù)價(jià)值;根據(jù)機(jī)構(gòu)改革后云平臺數(shù)據(jù)管理工作的新內(nèi)容、 新要求,對數(shù)據(jù)層、應(yīng)用層進(jìn)行調(diào)整、優(yōu)化,保障云平臺平穩(wěn)運(yùn)行;有力加強(qiáng)數(shù) 據(jù)治理、提高數(shù)據(jù)質(zhì)量,滿足當(dāng)前數(shù)據(jù)管理工作需要,支撐各類型數(shù)據(jù)應(yīng)用工作 需求,助力推動(dòng)征管模式變革和各項(xiàng)稅收政策改革,最終形成推動(dòng)數(shù)據(jù)管理思維變化,營造良好稅收數(shù)據(jù)生態(tài)。1.1.2 項(xiàng)目概述1.1.2.1項(xiàng)目現(xiàn)狀云平臺數(shù)據(jù)管理項(xiàng)目以云平臺為基礎(chǔ), 以云服務(wù)器軟件、負(fù)載均衡軟件SLB 對象存儲軟件OSS大數(shù)據(jù)計(jì)算服務(wù)軟件 ODPS數(shù)據(jù)可視化引擎DataV等18款 大數(shù)據(jù)產(chǎn)品為依托,構(gòu)建了以數(shù)據(jù)治理為核心、以一體化云平臺為載體、滿足各 類用戶需求的稅收大數(shù)據(jù)平臺。主要
6、完成平臺層、數(shù)據(jù)層、應(yīng)用層的建設(shè):1 .平臺層建設(shè)。主要包括計(jì)算存儲和網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件工具集、安全及運(yùn) 維監(jiān)控管理的建設(shè),從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù) 據(jù)及非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用需求的矛盾,搭建靈活、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù) 云環(huán)境,并構(gòu)建完整的三層服務(wù)模式。通過建設(shè)IaaS層,為全國數(shù)據(jù)大集中環(huán)境提供包括CPU內(nèi)存、存儲、網(wǎng)絡(luò)、操作系統(tǒng)等基礎(chǔ)設(shè)施資源,提高資源的利 用率,降低采購成本;通過建設(shè)PaaS平臺,基于IaaS提供的能力,以服務(wù)的方 式提供計(jì)算平臺和軟件組合,為最終用戶提供云環(huán)境下的應(yīng)用開發(fā)、 部署和運(yùn)行 平臺,解決應(yīng)用軟件開發(fā)的規(guī)范化問題,降低系統(tǒng)運(yùn)行維護(hù)成
7、本;通過建設(shè)SaaS 層,全國數(shù)據(jù)大集中環(huán)境為總局、省局、納稅人、相關(guān)部門提供個(gè)性化的數(shù)據(jù)服 務(wù)。2 .數(shù)據(jù)層建設(shè)。通過構(gòu)建數(shù)據(jù)治理體系和開展數(shù)據(jù)分析處理,將云平臺和工 程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺集于一體, 使金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù) 據(jù)和多來源的外部交換數(shù)據(jù)相互貫通, 實(shí)現(xiàn)各類數(shù)據(jù)的集中定義和管理,為建立 統(tǒng)一數(shù)據(jù)視圖、數(shù)據(jù)集市、各類分析業(yè)務(wù)的定義、指標(biāo)和規(guī)則定義以及數(shù)據(jù)集成 定義提供語義基礎(chǔ),同時(shí)提供對各類數(shù)據(jù)的審核管理和維護(hù)機(jī)制,維護(hù)數(shù)據(jù)的完整性、準(zhǔn)確性以及一致性,實(shí)現(xiàn)數(shù)據(jù)生命周期管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)審計(jì)等各項(xiàng) 功能。通過數(shù)據(jù)治理過程,使得數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量都能夠得到
8、持 續(xù)的提升,保證數(shù)據(jù)資產(chǎn)的長久價(jià)值。(1)基礎(chǔ)層完成了對稅務(wù)數(shù)據(jù)、外部數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)三類數(shù)據(jù)的集成, 共集成了六千余張表,同時(shí)完成了數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化以及非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)結(jié) 構(gòu)化數(shù)據(jù)等操作。(2)中間層完成了四大主題庫和標(biāo)簽體系的建設(shè)。四大主題庫分別是:組 織庫(法人和法人分支機(jī)構(gòu)),涉及模型近200個(gè);自然人庫,涉及模型近百個(gè); 稅務(wù)機(jī)關(guān)庫,涉及模型近200個(gè);關(guān)系庫(單位納稅人之間、單位納稅人與自然 人之間),涉及模型幾十個(gè)。同時(shí)構(gòu)建了企業(yè)、自然人、稅務(wù)機(jī)關(guān)標(biāo)簽體系,包 含:企業(yè)標(biāo)簽(一般納稅人標(biāo)簽、小規(guī)模納稅人標(biāo)簽、千戶集團(tuán)標(biāo)簽)、自然人 標(biāo)簽、稅務(wù)機(jī)關(guān)標(biāo)簽。(3)模型層完成了面向應(yīng)
9、用的數(shù)據(jù)模型構(gòu)建。在建設(shè)模型層的過程中,以 構(gòu)建面向應(yīng)用類數(shù)據(jù)模型和構(gòu)建分析挖掘類分析模型為原則,基于稅收動(dòng)態(tài)監(jiān)控、票流分析、關(guān)系云圖、增值稅發(fā)票查詢分析系統(tǒng)等應(yīng)用共設(shè)計(jì)數(shù)百個(gè)數(shù)據(jù)模型, 上千個(gè)指標(biāo)口徑。3 .應(yīng)用層建設(shè)?;谌珓?wù)數(shù)據(jù),建立多層次、多類型、多渠道的數(shù)據(jù)服務(wù)體 系,為總局各司局和省局不同類型用戶提供多維數(shù)據(jù)服務(wù),滿足各級稅務(wù)機(jī)關(guān)在決策、管理、執(zhí)行、研究等方面的工作需求。應(yīng)用層前期建設(shè)立足于稅收業(yè)務(wù)特 點(diǎn)、現(xiàn)狀和需求狀況,重點(diǎn)選取部分應(yīng)用進(jìn)行驗(yàn)證性和示范性開發(fā)。已開發(fā)用戶畫像、票流分析、納稅人關(guān)系云圖、納稅人關(guān)系分析、增值稅發(fā)票查詢分析系統(tǒng)、 風(fēng)險(xiǎn)情報(bào)系統(tǒng)、單管戶查詢、企業(yè)信息自助
10、查詢、數(shù)據(jù)資源需求管理、數(shù)據(jù)質(zhì)效 考核、稅收動(dòng)態(tài)監(jiān)控大屏版、稅收動(dòng)態(tài)監(jiān)控桌面版、云平臺訪問監(jiān)控以及涉稅專 業(yè)服務(wù)動(dòng)態(tài)監(jiān)控等應(yīng)用。4 .數(shù)據(jù)治理工作主要從五個(gè)方面開展:元數(shù)據(jù)管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù) 標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管理。在數(shù)據(jù)標(biāo)準(zhǔn)方面繼承了國家標(biāo)準(zhǔn)化內(nèi) 容,把控?cái)?shù)據(jù)建設(shè)標(biāo)準(zhǔn)。同時(shí)結(jié)合業(yè)務(wù)需要積累并整理了核心征管系統(tǒng)業(yè)務(wù)表單 和物理表的對照關(guān)系,形成了包含:核心征管系統(tǒng)、個(gè)稅系統(tǒng)、防偽稅控系統(tǒng)、 外部交換系統(tǒng)、出口退稅系統(tǒng)等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)字典。在數(shù)據(jù)質(zhì)量方面制定數(shù)據(jù) 質(zhì)量規(guī)則指標(biāo)二百多項(xiàng),推動(dòng)全國數(shù)據(jù)質(zhì)量持續(xù)優(yōu)化。5 .數(shù)據(jù)服務(wù)云平臺數(shù)據(jù)管理項(xiàng)目運(yùn)行一年以來,為總局多個(gè)業(yè)務(wù)司局提
11、供數(shù)據(jù)加工服務(wù); 承接總局稽查局的選案工作;承接納稅服務(wù)司納稅信用等級評定指標(biāo)調(diào)整測算工 作,為信用評價(jià)指標(biāo)調(diào)整提供數(shù)據(jù)依據(jù)等; 開展新辦企業(yè)預(yù)警模型、非正常戶預(yù) 警模型、進(jìn)銷不匹配模型等指標(biāo)設(shè)計(jì)測算工作。1.1.2.2項(xiàng)目目標(biāo)本項(xiàng)目旨在根據(jù)業(yè)務(wù)需求,對平臺層、數(shù)據(jù)層、應(yīng)用層實(shí)施有效的運(yùn)行維護(hù), 完成云平臺整體升級優(yōu)化完善,并根據(jù)機(jī)構(gòu)改革要求及進(jìn)程完成云平臺調(diào)整優(yōu)化 各項(xiàng)工作,保障云平臺平穩(wěn)運(yùn)行。1 .做好云平臺數(shù)據(jù)管理項(xiàng)目升級完善工作, 包括:基于云平臺開發(fā)、開放更 多數(shù)據(jù)應(yīng)用,豐富優(yōu)化云平臺的現(xiàn)有功能應(yīng)用場景, 創(chuàng)新應(yīng)用功能,提升云平臺 數(shù)據(jù)管理項(xiàng)目的應(yīng)用價(jià)值和潛能等內(nèi)容。 根據(jù)國家與各省
12、局需要,做好云平臺應(yīng) 用的增加及數(shù)據(jù)開放范圍的擴(kuò)大工作。 對各司局的遷移軟件,做好技術(shù)及軟件方 面的對接工作,滿足其數(shù)據(jù)庫創(chuàng)建、擴(kuò)容、變更等需求。2 .做好云平臺數(shù)據(jù)管理項(xiàng)目的運(yùn)行維護(hù)與數(shù)據(jù)治理工作,包括應(yīng)用系統(tǒng)日常巡檢和監(jiān)控、故障綜合分析及應(yīng)急處理、性能持續(xù)優(yōu)化等服務(wù),以保障云平臺數(shù) 據(jù)管理項(xiàng)目平穩(wěn)運(yùn)行。對云平臺的硬件擴(kuò)容提供相應(yīng)的技術(shù)支持, 做好對機(jī)器的 版本升級和應(yīng)用的性能測試等工作,保障數(shù)據(jù)處理和各類應(yīng)用能夠正常適應(yīng)新的 硬件平臺。按照關(guān)于數(shù)據(jù)治理組織機(jī)構(gòu)、流程制度以及配套支撐工具等要求, 做 好元數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型,數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全等工作,強(qiáng)化數(shù)據(jù)治 理能力,提高數(shù)據(jù)管理
13、水平,確保整體數(shù)據(jù)環(huán)境可靠、高效、安全,有力支撐征 管改革和稅制改革。3 .做好機(jī)構(gòu)改革涉及云平臺調(diào)整優(yōu)化工作,根據(jù)國家制定的國合并改革方案, 在完成金三系統(tǒng)合并、調(diào)整與地方稅費(fèi)全國集成基礎(chǔ)上,完成云平臺數(shù)據(jù)層、應(yīng) 用層的相應(yīng)調(diào)整優(yōu)化與功能開發(fā)工作,以保障數(shù)據(jù)及時(shí)、準(zhǔn)確集成至云平臺,并 按照最新的需求展示和供應(yīng)數(shù)據(jù)。1.1.2.3項(xiàng)目內(nèi)容云平臺數(shù)據(jù)管理升級完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)工作,重點(diǎn)需要完成對 云平臺數(shù)據(jù)管理項(xiàng)目的運(yùn)行維護(hù)、對已有功能的優(yōu)化完善及新增數(shù)據(jù)需求、應(yīng)用 功能的處理與設(shè)計(jì)開發(fā)以及機(jī)構(gòu)改革涉及云平臺調(diào)整優(yōu)化有關(guān)工作。 重點(diǎn)包括但 不限于以下內(nèi)容:云平臺數(shù)據(jù)管理升級完善及運(yùn)維和
14、機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目是在云平臺數(shù)據(jù) 管理項(xiàng)目建設(shè)成果基礎(chǔ)上,做好云平臺數(shù)據(jù)管理升級完善及運(yùn)維工作與機(jī)構(gòu)改革 涉及云平臺調(diào)整優(yōu)化工作兩項(xiàng)內(nèi)容:1.2總體設(shè)計(jì)方案1.2.1 總體定位及目標(biāo)云平臺數(shù)據(jù)管理項(xiàng)目是工程第二階段的重要組成部分,項(xiàng)目基于目前最新 的大數(shù)據(jù)處理技術(shù)手段和理念,借助金三全面上線的有利契機(jī),以大數(shù)據(jù)云平臺 為基礎(chǔ),集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求 主體提供更為全面豐富的決策和參考支持,構(gòu)建開放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。 項(xiàng)目定位集中體現(xiàn)了基礎(chǔ)性、創(chuàng)新性和示范性?;A(chǔ)性。一是構(gòu)建硬件基礎(chǔ),通過搭建靈活的、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù) 云環(huán)境,從硬件和技術(shù)層面
15、有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu) 化數(shù)據(jù)分析應(yīng)用需求的矛盾。二是夯實(shí)管理基礎(chǔ),以打造成熟完善的數(shù)據(jù)治理體 系為重點(diǎn),為保障數(shù)據(jù)資產(chǎn)質(zhì)量提供支撐。三是提供應(yīng)用基礎(chǔ),為各司局、省局 自行開發(fā)應(yīng)用項(xiàng)目提供基礎(chǔ)數(shù)據(jù)和工具,鼓勵(lì)多樣性應(yīng)用開發(fā)。創(chuàng)新性。一是數(shù)據(jù)利用創(chuàng)新,遵循總體架構(gòu)要求,繼承前期建設(shè)成果,在保 持四大應(yīng)用系統(tǒng)總體格局不變的情況下, 實(shí)現(xiàn)數(shù)據(jù)全國大集中。二是管理思維創(chuàng) 新,整合數(shù)據(jù)資源和管理資源,以統(tǒng)一平臺來解決之前總局各司局?jǐn)?shù)據(jù)利用各自 為政、重復(fù)建設(shè)、標(biāo)準(zhǔn)不一致、成果不能共享等問題。三是服務(wù)模式創(chuàng)新,體現(xiàn) “眾包協(xié)助”要求,以提供基礎(chǔ)數(shù)據(jù)服務(wù)為主,形成數(shù)據(jù)統(tǒng)一加工和應(yīng)用多
16、樣開 發(fā)結(jié)合的格局。示范性。為全國各省局?jǐn)?shù)據(jù)開發(fā)利用提供從硬件建設(shè)、數(shù)據(jù)治理和應(yīng)用開 發(fā)的示范性模板,推進(jìn)全收數(shù)據(jù)利用水平提升。云平臺數(shù)據(jù)管理項(xiàng)目實(shí)現(xiàn)了稅收征管數(shù)據(jù)的全國集中和規(guī)范管理,為各級稅務(wù)機(jī)關(guān)提供了強(qiáng)大計(jì)算處理能力,有機(jī)整合大數(shù)據(jù)技術(shù),全面集成內(nèi)部數(shù)據(jù)、積 極拓展外部數(shù)據(jù)、強(qiáng)化數(shù)據(jù)治理能力,實(shí)現(xiàn)了數(shù)據(jù)的過程監(jiān)控;建立了稅務(wù)數(shù)據(jù) 的資產(chǎn)化管理模式,并以用戶為核心提供差異化的數(shù)據(jù)服務(wù), 形成了開發(fā)協(xié)作的 稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。同時(shí),加強(qiáng)外部數(shù)據(jù)交換,實(shí)現(xiàn)了稅務(wù)數(shù)據(jù)與外部門數(shù)據(jù)的 有效共享整合,為國家信息共享化建設(shè)提供了稅務(wù)方案。云平臺數(shù)據(jù)管理項(xiàng)目升級完善及運(yùn)維和機(jī)構(gòu)改革軟件服務(wù)項(xiàng)目以云平臺數(shù)
17、據(jù)管理項(xiàng)目的建設(shè)內(nèi)容為基礎(chǔ),根據(jù)的業(yè)務(wù)需求和國合并工作要求, 對平臺功能 進(jìn)行持續(xù)性升級完善,集中、拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范 疇,提升數(shù)據(jù)治理能力,為各需求主體提供更為全面豐富的決策和參考支持,并提供必要的基礎(chǔ)運(yùn)維,保障云平臺正常運(yùn)行。1.2.2 設(shè)計(jì)原則及約束1.2,2.1總體設(shè)計(jì)原則大數(shù)據(jù)云平臺建設(shè)與開發(fā),需要協(xié)調(diào)“整體與局部、集中與分散、先進(jìn)與實(shí) 用、近期與長遠(yuǎn)、統(tǒng)一與個(gè)性”之間的矛盾,涉及到數(shù)據(jù)庫、數(shù)據(jù)倉庫、聯(lián)機(jī)分 析處理(OLAP、數(shù)據(jù)挖掘等多技術(shù)、多學(xué)科的交叉,是一項(xiàng)復(fù)雜的工程。項(xiàng)目建設(shè)應(yīng)遵循“整體規(guī)劃、大膽創(chuàng)新、分步實(shí)施、統(tǒng)一規(guī)范”的總體原則, 在總體規(guī)劃上要
18、體現(xiàn)體系化、規(guī)范化,在具體設(shè)計(jì)上體現(xiàn)前瞻性、創(chuàng)新性,在項(xiàng) 目實(shí)施中分步驟、保重點(diǎn),按照工程計(jì)劃逐步實(shí)現(xiàn)建設(shè)目標(biāo)。大數(shù)據(jù)云平臺建設(shè)與開發(fā)應(yīng)滿足但不限于以下原則要求:1.2.2.1.1 實(shí)現(xiàn)結(jié)構(gòu)上穩(wěn)定、靈活、可擴(kuò)展底層的數(shù)據(jù)治理和上層應(yīng)用開發(fā)在架構(gòu)上保持松耦合。上層應(yīng)用可根據(jù)用戶需求不斷開發(fā)、優(yōu)化或調(diào)整,數(shù)據(jù)資源層提供標(biāo)準(zhǔn)化接口,以服務(wù)的形式封裝數(shù) 據(jù),屏蔽底層物理數(shù)據(jù)庫信息和數(shù)據(jù)結(jié)構(gòu), 增強(qiáng)系統(tǒng)靈活性,在充分滿足現(xiàn)有需 求的基礎(chǔ)上兼顧后期發(fā)展,在相對穩(wěn)定的架構(gòu)下,選擇成熟的產(chǎn)品與技術(shù),滿足 稅務(wù)未來(5年)業(yè)務(wù)需求及技術(shù)的發(fā)展變化。1.2.2.1.2 設(shè)計(jì)上開放、一致、安全在設(shè)計(jì)時(shí)從縱向、橫向、
19、前向、后向多維互聯(lián)角度充分考慮,建立完整的數(shù) 據(jù)管理體系,遵守統(tǒng)一的數(shù)據(jù)源、統(tǒng)一的數(shù)據(jù)模型、統(tǒng)一的數(shù)據(jù)接口、統(tǒng)一的接口標(biāo)準(zhǔn)等原則,保障數(shù)據(jù)的一致性。同時(shí)兼顧系統(tǒng)的開放性,充分考慮各類應(yīng)用 需求,包括大數(shù)據(jù)應(yīng)用、傳統(tǒng)數(shù)據(jù)應(yīng)用,涵蓋統(tǒng)計(jì)監(jiān)控、宏觀決策、微觀分析、 公眾服務(wù)等。且不設(shè)置應(yīng)用總集成概念和實(shí)體,以利于各司局、部分省局及其他 相關(guān)主體自主開發(fā)各類應(yīng)用。此外設(shè)計(jì)上也不局限于分析類應(yīng)用, 可嘗試海量并 發(fā)查詢類應(yīng)用等應(yīng)用模式。最終實(shí)現(xiàn)對敏感數(shù)據(jù)與應(yīng)用訪問的權(quán)限控制和軌跡跟 蹤,加強(qiáng)核心數(shù)據(jù)的管控,確保系統(tǒng)數(shù)據(jù)安全。管理數(shù)據(jù)權(quán)限并實(shí)施數(shù)據(jù)訪問控 制,針對各應(yīng)用系統(tǒng)組織實(shí)施安全審計(jì)。1.2.2.1
20、.3 標(biāo)準(zhǔn)上規(guī)范、易懂、通用完善業(yè)務(wù)、技術(shù)、管理標(biāo)準(zhǔn)規(guī)范體系,包括制定和推廣總體標(biāo)準(zhǔn)、信息系統(tǒng) 標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)和業(yè)務(wù)規(guī)范等,確保各類命名規(guī)范,業(yè)務(wù)規(guī)則定義,度量方式等 的規(guī)范性和通用性,并使用統(tǒng)一的業(yè)務(wù)語言進(jìn)行描述,易于業(yè)務(wù)人員和技術(shù)人員 的理解使用。同時(shí)建立配套的運(yùn)行維護(hù)和數(shù)據(jù)治理機(jī)制,保障系統(tǒng)的有機(jī)生命力, 支撐業(yè)務(wù)發(fā)展的需要。1.2.2.1.4 用戶體驗(yàn)上友好、便利、易用基于SO咪構(gòu)開發(fā)數(shù)據(jù)應(yīng)用,在技術(shù)選擇上,充分利用云計(jì)算、大數(shù)據(jù)等前 沿應(yīng)用技術(shù)的最新成果,借助云的靈活性,更好的滿足稅務(wù)行業(yè)可變業(yè)務(wù)的需求, 借助云的敏捷性,更快的響應(yīng)業(yè)務(wù)要求,通過大數(shù)據(jù)提供的海量數(shù)據(jù)處理能力, 更充分
21、的挖掘稅收數(shù)據(jù)的價(jià)值。在業(yè)務(wù)展示上充分利用數(shù)據(jù)可視化新技術(shù),借助 于圖形化手段,從不同的維度觀察數(shù)據(jù),從而對數(shù)據(jù)進(jìn)行更深入的觀察和分析。 在數(shù)據(jù)應(yīng)用集成層提供豐富的數(shù)據(jù)分析工具,支持模塊的拖拽和自由組合。1.2.2.2總體設(shè)計(jì)約束總體設(shè)計(jì)包括總體架構(gòu)設(shè)計(jì)和數(shù)據(jù)治理機(jī)制設(shè)計(jì)兩個(gè)部分。1.2.2.2.1數(shù)據(jù)治理機(jī)制1.2.2.2.1.1 設(shè)計(jì)目標(biāo)根據(jù)數(shù)據(jù)本項(xiàng)目數(shù)據(jù)治理要求與約束,完成國家數(shù)據(jù)治理機(jī)制建設(shè)。1.2.2.2.1.2 設(shè)計(jì)要求數(shù)據(jù)治理涵蓋了人員,流程和技術(shù),是一系列改變數(shù)據(jù)使用行為的過程, 它 從根本上改變業(yè)務(wù)和信息技術(shù)的使用方法。在內(nèi)容上,要求實(shí)現(xiàn)元數(shù)據(jù)管理、數(shù) 據(jù)標(biāo)準(zhǔn)管理和數(shù)據(jù)質(zhì)量管
22、理三個(gè)方面的機(jī)制和流程建設(shè)。1.2.2.2.1.3 設(shè)計(jì)約束遵循本項(xiàng)目數(shù)據(jù)治理機(jī)制要求和約束。1.2.3 總體應(yīng)用架構(gòu)設(shè)計(jì)根據(jù)招標(biāo)文件中要求,云平臺數(shù)據(jù)管理項(xiàng)目是以大數(shù)據(jù)云平臺為基礎(chǔ), 集中、 拓寬和整合內(nèi)外部數(shù)據(jù)資源,統(tǒng)一規(guī)范數(shù)據(jù)應(yīng)用范疇,為各需求主體提供更為全 面豐富的決策和參考支持,構(gòu)建開放協(xié)作的稅務(wù)數(shù)據(jù)生態(tài)環(huán)境。主要包括平臺層 建設(shè)、數(shù)據(jù)層建設(shè)和應(yīng)用層建設(shè)。蜒一工作單音總后省后內(nèi)網(wǎng)i內(nèi)網(wǎng)第三J5S5UB匿務(wù)用蘭:&蘆卷息國掙干白立"NF不育*廿亞事隼苜應(yīng)用施ts中臺敷尼密乎士應(yīng)用集成平力喈一云計(jì)算支撐平臺:系統(tǒng)搭建靈活、可隨時(shí)調(diào)用計(jì)算資源的數(shù)據(jù)云環(huán)境,并構(gòu)建完整的三層
23、服 務(wù)模式,包括計(jì)算存儲和網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件工具集、安全及運(yùn)維監(jiān)控管理的建 設(shè),從硬件和技術(shù)層面有效解決傳統(tǒng)技術(shù)結(jié)構(gòu)不足以支撐海量數(shù)據(jù)及非結(jié)構(gòu)化數(shù) 據(jù)分析應(yīng)用需求的矛盾。大數(shù)據(jù)支撐平臺:大數(shù)據(jù)支撐平臺是用于各項(xiàng)數(shù)據(jù)相關(guān)工作的云計(jì)算產(chǎn)品和大數(shù)據(jù)工具軟件 集合,利用現(xiàn)有或者采購的相關(guān)軟件產(chǎn)品,構(gòu)建數(shù)據(jù)治理體系和開展數(shù)據(jù)分析處 理,將大數(shù)據(jù)云平臺和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺集于一體,使的金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù)據(jù)和多來源的外部交換數(shù)據(jù)相互貫通,持續(xù)提升數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)“好用、足用”的目標(biāo)。應(yīng)用平臺層:在全收數(shù)據(jù)大集中和外部數(shù)據(jù)擴(kuò)展基礎(chǔ)上,為總局和各司局及部分省局提
24、供方式靈活、內(nèi)容豐富的自主應(yīng)用開發(fā)的平臺。 本項(xiàng)目實(shí)現(xiàn)主體畫像、全國視角 的納稅人遵從分析和稅收動(dòng)態(tài)展示 3類驗(yàn)證和示范應(yīng)用。1.2.4 總體數(shù)據(jù)架構(gòu)設(shè)計(jì)根據(jù)總局?jǐn)?shù)據(jù)層平臺的要求,我們將需求細(xì)分為數(shù)據(jù)集成、數(shù)據(jù)治理、主體 匯總、數(shù)據(jù)應(yīng)用等4個(gè)技術(shù)支撐平臺,以承擔(dān)所有數(shù)據(jù)活動(dòng)涉及的數(shù)據(jù)獲取、 模 型組織、信息加工、質(zhì)量管理、結(jié)果展現(xiàn)等處理功能。1.2.4.1數(shù)據(jù)框架設(shè)計(jì)數(shù)據(jù)應(yīng)用1 數(shù)據(jù)治理 Al_分析模型數(shù)據(jù)挖掘數(shù)據(jù)供應(yīng)h一1/廣元數(shù)據(jù)管理數(shù)據(jù)匯總,數(shù)據(jù)主體定義主體匯總關(guān)系定義in一 二數(shù)據(jù)集成I數(shù)據(jù)定義11數(shù)據(jù)抽取11數(shù)據(jù)清洗11數(shù)據(jù)轉(zhuǎn)換I I數(shù)據(jù)加載1數(shù)據(jù)集成負(fù)責(zé)數(shù)據(jù)集成,通過調(diào)度控制和規(guī)則
25、管理實(shí)現(xiàn)對數(shù)據(jù)集成的任務(wù)管理,數(shù)據(jù) 集成平臺將源數(shù)據(jù)(核心征管、電子稅務(wù)、出口退稅、外部數(shù)據(jù)等)通過ETL激據(jù)復(fù)制的數(shù)據(jù)加工、清洗、轉(zhuǎn)換,完成從源數(shù)據(jù)數(shù)據(jù)準(zhǔn)備區(qū) 統(tǒng)一數(shù)據(jù)視圖。加工中出現(xiàn)的錯(cuò)誤預(yù)警提交給數(shù)據(jù)治理平臺的數(shù)據(jù)質(zhì)量管理應(yīng)用。2數(shù)據(jù)匯聚匯聚數(shù)據(jù)是將基礎(chǔ)數(shù)據(jù)區(qū)的數(shù)據(jù)按照納稅人、業(yè)務(wù)日期、業(yè)務(wù)狀態(tài)等維度進(jìn) 行的輕度匯總的事實(shí)表和事實(shí)表關(guān)聯(lián)的維度表。3數(shù)據(jù)應(yīng)用由查詢統(tǒng)計(jì)、征管狀況分析、報(bào)表管理、風(fēng)險(xiǎn)管理、政策評估、績效管理、知識管理、 稅收收入核算分析系統(tǒng)、電子檔案管理等部分和日常應(yīng)用管理組成。本包負(fù)責(zé):查詢統(tǒng)計(jì)、 征管狀況分析、報(bào)表管理、稅收收入核算分析系統(tǒng)、電子檔案管理的建設(shè)和大數(shù)據(jù)平臺
26、的日 常應(yīng)用管理建設(shè)。4數(shù)據(jù)治理負(fù)責(zé)環(huán)境的數(shù)據(jù)治理,它是結(jié)合數(shù)據(jù)治理相關(guān)的組織、制度和流程和數(shù)據(jù)標(biāo) 準(zhǔn)完成對數(shù)據(jù)的治理,治理內(nèi)容包括:數(shù)據(jù)質(zhì)量的管理、元數(shù)據(jù)的管理、數(shù)據(jù)生 命周期的管理、以及數(shù)據(jù)審計(jì)管理等。1.2.4.2數(shù)據(jù)框架細(xì)化設(shè)計(jì)運(yùn)行監(jiān)控 數(shù)據(jù)審計(jì)元數(shù)據(jù)管理數(shù)據(jù)規(guī)范管理數(shù)據(jù)中間層數(shù)據(jù)質(zhì)量控制數(shù)據(jù)準(zhǔn)備層也挖掘應(yīng)用層數(shù)據(jù)擴(kuò)展利用數(shù)據(jù)管理數(shù)據(jù)報(bào)表數(shù)據(jù)分析數(shù)據(jù)準(zhǔn)備區(qū)統(tǒng)一數(shù)據(jù)視圖區(qū)數(shù)據(jù)倉庫區(qū)元數(shù)據(jù)據(jù)范 數(shù) 數(shù)據(jù)集成抽取規(guī)錯(cuò)誤預(yù)范警ETL/ 數(shù) 據(jù)復(fù)制任務(wù)調(diào) 度數(shù)據(jù)源1、基礎(chǔ)數(shù)據(jù)層基于目前總局?jǐn)?shù)據(jù)狀況,數(shù)據(jù)采集的源頭主要包含:各類稅收業(yè)務(wù)系統(tǒng)數(shù)據(jù)、 外部交換數(shù)據(jù)、互聯(lián)網(wǎng)開放數(shù)據(jù)。稅收業(yè)務(wù)系統(tǒng):稅收業(yè)
27、務(wù)系統(tǒng)是本次數(shù)據(jù)體系中最主要的數(shù)據(jù)源頭,稅務(wù)業(yè)務(wù)相關(guān)的數(shù)據(jù)主要從這些系統(tǒng)中獲取。核心征管系統(tǒng)數(shù)據(jù)覆蓋 13個(gè)業(yè)務(wù)域的 業(yè)務(wù)數(shù)據(jù),同時(shí)發(fā)票數(shù)據(jù)和出口退稅數(shù)據(jù)雖然系統(tǒng)還沒有統(tǒng)一, 但是會統(tǒng)一采集 到核心征管數(shù)據(jù)體系內(nèi)。交換數(shù)據(jù):交換數(shù)據(jù)分為兩個(gè)部分,總局統(tǒng)一交換數(shù)據(jù)和各省局交換數(shù)據(jù)。 在基礎(chǔ)數(shù)據(jù)層會單獨(dú)規(guī)劃交換數(shù)據(jù)域, 統(tǒng)一規(guī)劃數(shù)據(jù)交換模型,將總局交換數(shù)據(jù) 中數(shù)據(jù)價(jià)值度高、數(shù)據(jù)質(zhì)量高、數(shù)據(jù)穩(wěn)定性好的數(shù)據(jù)和選取幾個(gè)省局的交換數(shù)據(jù), 合并數(shù)據(jù)結(jié)構(gòu),采集到統(tǒng)一的數(shù)據(jù)交換域?;ヂ?lián)網(wǎng)數(shù)據(jù):互聯(lián)網(wǎng)是一個(gè)開放式的數(shù)據(jù)源,在本次數(shù)據(jù)體系和應(yīng)用的建 設(shè)中,需要依賴互聯(lián)網(wǎng)的開放數(shù)據(jù)作為應(yīng)用的基礎(chǔ)數(shù)據(jù),參與稅務(wù)數(shù)據(jù)價(jià)值
28、挖掘過程中?;ヂ?lián)網(wǎng)的數(shù)據(jù)獲取會利用平臺的爬蟲工具, 定向的獲取互聯(lián)網(wǎng)數(shù)據(jù)。本 次需要建設(shè)互聯(lián)網(wǎng)爬數(shù)的平臺,能夠滿足甲方不斷增加數(shù)據(jù)源,調(diào)整數(shù)據(jù)爬取深 度的要求,滿足爬取數(shù)據(jù)從非結(jié)構(gòu)化到結(jié)構(gòu)化存儲的要求;2、數(shù)據(jù)中間層數(shù)據(jù)中間層的建設(shè)主要的目的是將采集和整理后的基礎(chǔ)數(shù)據(jù), 以某個(gè)主體或 者關(guān)系,將數(shù)據(jù)聯(lián)系起來。設(shè)計(jì)擴(kuò)展性強(qiáng)的數(shù)據(jù)模型,隨著原始業(yè)務(wù)數(shù)據(jù)的逐步 豐富,不停豐富主體的描述、行為及管理類的數(shù)據(jù)。數(shù)據(jù)中間層在整個(gè)數(shù)據(jù)體系建設(shè)中起到通的作用,以主體維度聯(lián)通各種來源數(shù)據(jù)。聯(lián)通后的中間層數(shù)據(jù),將提供給下游模型和挖掘應(yīng)用更豐富、更標(biāo)準(zhǔn)、更 易用的生產(chǎn)原料??偩执髷?shù)據(jù)云平臺將具有強(qiáng)大得數(shù)據(jù)計(jì)算和存儲
29、能力?;谄脚_的能力和 互聯(lián)網(wǎng)數(shù)據(jù)建設(shè)的設(shè)計(jì)思路,在數(shù)據(jù)中間層的建設(shè)中不會做復(fù)雜的業(yè)務(wù)邏輯加工, 保留業(yè)務(wù)的事實(shí)明細(xì)數(shù)據(jù)。增強(qiáng)數(shù)據(jù)中間層的擴(kuò)展性和復(fù)用性,業(yè)務(wù)邏輯的加工 放在應(yīng)用和挖掘?qū)油瓿?。這樣會壓縮整個(gè)數(shù)據(jù)處理的過程,同時(shí)有利于數(shù)據(jù)口徑 的統(tǒng)一和數(shù)據(jù)質(zhì)量的控制?;谀壳翱偩謱τ诖髷?shù)據(jù)應(yīng)用的要求, 本次數(shù)據(jù)中間 層的建設(shè)將著重三個(gè)主體庫的建設(shè):企業(yè)庫、自然人庫、關(guān)系庫。3數(shù)據(jù)挖掘?qū)訑?shù)據(jù)挖掘是指利用打通后的數(shù)據(jù),針對需要數(shù)據(jù)支撐的業(yè)務(wù),進(jìn)行數(shù)據(jù)模 型的建設(shè)和數(shù)據(jù)價(jià)值的挖掘。基于本次云平臺數(shù)據(jù)管理項(xiàng)目的業(yè)務(wù)需求,數(shù)據(jù)模型和挖掘?qū)鞴芊?析模型、企業(yè)風(fēng)險(xiǎn)控制模型、個(gè)人風(fēng)險(xiǎn)控制模型、企業(yè)標(biāo)簽體系
30、模型、自然人標(biāo)簽體系模型征管分析模型:基于目前總局對于征管工作所規(guī)劃的指標(biāo)體系, 提煉出當(dāng)前 業(yè)務(wù)狀態(tài)下最關(guān)鍵和重要的指標(biāo),對這些指標(biāo)進(jìn)行數(shù)據(jù)建模,每日生產(chǎn)出數(shù)據(jù)指 標(biāo)數(shù)據(jù),并持續(xù)跟蹤指標(biāo)的變化情況,為征管工作分析應(yīng)用提供數(shù)據(jù)支撐。企業(yè)標(biāo)簽體系模型:針對目前總局對于企業(yè)征稅管理的需要, 設(shè)計(jì)對企業(yè)進(jìn) 行分類、刻畫的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過對企業(yè)庫的數(shù)據(jù) 進(jìn)行數(shù)據(jù)挖掘,獲得刻畫企業(yè)的標(biāo)簽數(shù)據(jù)。自然人標(biāo)簽體系模型:針對目前總局對于自然人征稅管理的需要, 設(shè)計(jì)對自 然人進(jìn)行分類、刻畫的描述標(biāo)簽,制定標(biāo)簽業(yè)務(wù)含義及數(shù)據(jù)算法,通過對自然人 庫的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得刻畫自然人的標(biāo)簽數(shù)據(jù)
31、。1.3數(shù)據(jù)治理方案1.3.1 概述數(shù)據(jù)治理體系將云平臺和工程規(guī)劃范圍內(nèi)的其他數(shù)據(jù)平臺集于一體,使金三生產(chǎn)系統(tǒng)數(shù)據(jù)、總局保留軟件數(shù)據(jù)和多來源的外部交換數(shù)據(jù)相互貫通,實(shí)現(xiàn)各類 數(shù)據(jù)的集中定義和管理,為建立統(tǒng)一數(shù)據(jù)視圖、數(shù)據(jù)集市、各類分析業(yè)務(wù)的定義、 指標(biāo)和規(guī)則定義以及數(shù)據(jù)集成定義提供語義基礎(chǔ), 同時(shí)提供對各類數(shù)據(jù)的審核管 理和維護(hù)機(jī)制,維護(hù)數(shù)據(jù)的完整性、準(zhǔn)確性以及一致性,實(shí)現(xiàn)數(shù)據(jù)生命周期管理、 數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)審計(jì)等各項(xiàng)功能。通過數(shù)據(jù)治理過程,使得數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)內(nèi)容 以及數(shù)據(jù)質(zhì)量都能夠得到持續(xù)的提升,保證數(shù)據(jù)資產(chǎn)的長久價(jià)值。1.3.2 數(shù)據(jù)管理制度與機(jī)制數(shù)據(jù)管理規(guī)章制度是將數(shù)據(jù)管理體系實(shí)施中的重要
32、步驟、行動(dòng)和任務(wù)的處理方式、途徑和評估等進(jìn)行規(guī)范和固化,概括和規(guī)定如何實(shí)施數(shù)據(jù)管理體系、 如何 考核實(shí)施結(jié)果以及如何進(jìn)一步完善整套機(jī)制,為數(shù)據(jù)管理體系建設(shè)的參與者提供 可以遵照執(zhí)行的原則和具體方法。政策規(guī)章制度以固化的、標(biāo)準(zhǔn)化的形式來描述管理決策分析平臺數(shù)據(jù)管理模 型中設(shè)計(jì)的組織架構(gòu)、崗位職責(zé)、工作流程等各項(xiàng)內(nèi)容。這些規(guī)范與以往經(jīng)營活 動(dòng)中發(fā)布和執(zhí)行的很多數(shù)據(jù)管理相關(guān)的政策規(guī)章制度是類似的,但數(shù)據(jù)管理的政策規(guī)章制度是針對數(shù)據(jù)管理各管理主題本身要解決的問題以及管理主題之間的 協(xié)調(diào)性問題做出相應(yīng)的規(guī)定。在此定義的數(shù)據(jù)管理框架還應(yīng)包括:明確數(shù)據(jù)管理框架的目的和重大意義、 基本原則和定位、所遵循的外部
33、或內(nèi)部要求、各相關(guān)方的義務(wù)和權(quán)利、績效考核 手段、可供使用的業(yè)務(wù)手段和技術(shù)手段、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)傳輸、數(shù)據(jù)質(zhì)量控制和 監(jiān)控、需要補(bǔ)充完善的規(guī)章制度等。數(shù)據(jù)管理制度與機(jī)制要求如下:1,按照數(shù)據(jù)治理體系要求,根據(jù)數(shù)據(jù)治理工作具體實(shí)踐持續(xù)協(xié)助完善數(shù)據(jù)管 理制度和機(jī)制,修訂數(shù)據(jù)治理體系規(guī)范。2,按季度編寫數(shù)據(jù)治理報(bào)告,報(bào)告應(yīng)基于該季度數(shù)據(jù)治理工作情況編寫, 并 針對數(shù)據(jù)治理中的問題提出分析改善方案。1.3.3 數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范建設(shè)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范是總局信息化標(biāo)準(zhǔn)的一部分,是對總局管理所涉及的各項(xiàng)數(shù) 據(jù)的定義與解釋,以及數(shù)據(jù)質(zhì)量及安全性要求的統(tǒng)一定義。 數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范著重于 對稅務(wù)局各業(yè)務(wù)部門使用的通用及共享數(shù)據(jù)
34、制定一套大家共同接受的業(yè)務(wù)概念 及技術(shù)實(shí)施時(shí)的統(tǒng)一定義。數(shù)據(jù)標(biāo)準(zhǔn)主要內(nèi)容包括:業(yè)務(wù)數(shù)據(jù)、數(shù)據(jù)模型、數(shù)據(jù) 交互等;數(shù)據(jù)元素定義的業(yè)務(wù)規(guī)則;數(shù)據(jù)實(shí)施的相關(guān)技術(shù)要求,例如:數(shù)據(jù)的存 儲格式、質(zhì)量問題等。由于稅務(wù)業(yè)務(wù)在不斷的發(fā)展和變化,反映稅務(wù)業(yè)務(wù)的數(shù)據(jù)標(biāo)準(zhǔn)也是一個(gè)動(dòng) 態(tài)的管理目標(biāo)。在數(shù)據(jù)標(biāo)準(zhǔn)的制定工作初步完成后, 數(shù)據(jù)標(biāo)準(zhǔn)的日常維護(hù)和更新 工作就成為保證數(shù)據(jù)標(biāo)準(zhǔn)得以遵照和執(zhí)行的基礎(chǔ)。數(shù)據(jù)標(biāo)準(zhǔn)管理流程作為數(shù)據(jù)管 理的重要組成部分,它的主要目標(biāo)是明確定義數(shù)據(jù)標(biāo)準(zhǔn)的維護(hù)流程,明確數(shù)據(jù)標(biāo)準(zhǔn)管理的組織架構(gòu),為數(shù)據(jù)標(biāo)準(zhǔn)的管理提供一套端到端的管理機(jī)制和維護(hù)環(huán)境。以下管理流程的建立方法著重說明在數(shù)據(jù)管理流程的框架設(shè)
35、計(jì)下,數(shù)據(jù)標(biāo)準(zhǔn)的管 理流程是如何建立起來的。數(shù)據(jù)標(biāo)準(zhǔn)管理工作負(fù)責(zé)制定和維護(hù)全部業(yè)務(wù)經(jīng)營涉及的數(shù)據(jù)標(biāo)準(zhǔn),通過系統(tǒng)的實(shí)施逐步推廣數(shù)據(jù)標(biāo)準(zhǔn)的落實(shí)。數(shù)據(jù)標(biāo)準(zhǔn)管理體現(xiàn)在數(shù)據(jù)標(biāo)準(zhǔn)的制定、審核、 執(zhí)行、反饋和爭議協(xié)調(diào)等各個(gè)工作環(huán)節(jié)中。數(shù)據(jù)標(biāo)準(zhǔn)的制定需要參考標(biāo)準(zhǔn)機(jī)構(gòu)制 定的數(shù)據(jù)標(biāo)準(zhǔn),同時(shí)也應(yīng)參考各個(gè)部門內(nèi)部使用的特定數(shù)據(jù)的定義。數(shù)據(jù)標(biāo)準(zhǔn)管理的對象是稅務(wù)局所有生產(chǎn)、管理決策的數(shù)據(jù),不包括為維護(hù) 系統(tǒng)運(yùn)行而設(shè)置的參數(shù)型數(shù)據(jù),如系統(tǒng)日志的數(shù)據(jù)定義等。數(shù)據(jù)標(biāo)準(zhǔn)采用數(shù)據(jù)分 類管理的方式對數(shù)據(jù)進(jìn)行定義和管理。 參考領(lǐng)先實(shí)踐的經(jīng)驗(yàn),數(shù)據(jù)標(biāo)準(zhǔn)可以結(jié)合 以下兩種分類方式進(jìn)行管理:按照共享程度分類根據(jù)數(shù)據(jù)的共享程度,稅務(wù)的數(shù)據(jù)可
36、歸為三大類:通用數(shù)據(jù)、共享數(shù)據(jù)、部門特定數(shù)據(jù)。其中,通用數(shù)據(jù)是指那些由各業(yè)務(wù)部門共享的數(shù)據(jù), 如查詢統(tǒng)計(jì) 數(shù)據(jù)、報(bào)表數(shù)據(jù)等;共享數(shù)據(jù)是指那些由多個(gè)業(yè)務(wù)部門共同使用的數(shù)據(jù);而特定數(shù)據(jù)是指那些專屬于某些應(yīng)用系統(tǒng)或業(yè)務(wù)部門的數(shù)據(jù)。 數(shù)據(jù)標(biāo)準(zhǔn)管理的對象范圍 包括這三類數(shù)據(jù),但數(shù)據(jù)標(biāo)準(zhǔn)的推廣實(shí)施可先從通用數(shù)據(jù)開始, 最后將部門特定 數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化管理;按照數(shù)據(jù)產(chǎn)生方式分類根據(jù)不同產(chǎn)生方式,數(shù)據(jù)可歸為三大類:基礎(chǔ)數(shù)據(jù)、衍生數(shù)據(jù)、公共代碼 類數(shù)據(jù)。其中,基礎(chǔ)數(shù)據(jù)由系統(tǒng)生成或直接錄入, 衍生類數(shù)據(jù)由基礎(chǔ)數(shù)據(jù)通過轉(zhuǎn) 換和計(jì)算產(chǎn)生,公共代碼類數(shù)據(jù)是通用的共享代碼,是特殊的基礎(chǔ)數(shù)據(jù)。根據(jù)的具體情況并參照以往標(biāo)準(zhǔn)化工
37、作的實(shí)踐,數(shù)據(jù)標(biāo)準(zhǔn)管理工作應(yīng)參照 以下指導(dǎo)原則:數(shù)據(jù)標(biāo)準(zhǔn)的推廣執(zhí)行必須遵循循序漸進(jìn)的原則。數(shù)據(jù)標(biāo)準(zhǔn)管理小組不僅是 標(biāo)準(zhǔn)的制定和管理組織,而且還是提供數(shù)據(jù)標(biāo)準(zhǔn)咨詢的內(nèi)部服務(wù)組織, 為各項(xiàng)目 的順利開展提供數(shù)據(jù)標(biāo)準(zhǔn)定義的解釋和數(shù)據(jù)標(biāo)準(zhǔn)使用的培訓(xùn)。數(shù)據(jù)標(biāo)準(zhǔn)的制定應(yīng)參照國際、國內(nèi)、行業(yè)等標(biāo)準(zhǔn),并結(jié)合稅務(wù)行業(yè)的實(shí)際 需求。數(shù)據(jù)標(biāo)準(zhǔn)的定義要與行業(yè)、國內(nèi)及國際的數(shù)據(jù)標(biāo)準(zhǔn)相適應(yīng),在充分考慮和 尊重現(xiàn)有數(shù)據(jù)情況等的基礎(chǔ)上,結(jié)合系統(tǒng)現(xiàn)實(shí)和未來的切實(shí)需要,編制或補(bǔ)充相 應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)準(zhǔn)定義應(yīng)具有前瞻性。數(shù)據(jù)標(biāo)準(zhǔn)定義的前瞻性,要求已經(jīng)定義的數(shù) 據(jù)標(biāo)準(zhǔn)能夠在一段時(shí)間內(nèi)相對穩(wěn)定地滿足總局對數(shù)據(jù)標(biāo)準(zhǔn)化的要求,而不是頻
38、繁地更改與修訂。完善的數(shù)據(jù)標(biāo)準(zhǔn)審閱流程。鑒于數(shù)據(jù)標(biāo)準(zhǔn)的重要性及跨業(yè)務(wù)領(lǐng)域共用的特 點(diǎn),為保證數(shù)據(jù)標(biāo)準(zhǔn)定義的質(zhì)量滿足準(zhǔn)確性、通用性、前瞻性等要求,需要建立 完善的數(shù)據(jù)標(biāo)準(zhǔn)審閱流程。審閱過程要充分征求業(yè)務(wù)部門、數(shù)據(jù)標(biāo)準(zhǔn)主管部門、 業(yè)務(wù)部門業(yè)務(wù)專家等各方面的意見, 并據(jù)此制定相對完善的、可用性強(qiáng)的數(shù)據(jù)標(biāo) 準(zhǔn)。1.3.3.1 一致性維度標(biāo)準(zhǔn)一致性維度是指具有一致的維度關(guān)鍵字、 一致的屬性列名字、一致的屬性定 義以及一致的屬性值(將轉(zhuǎn)化成一致的報(bào)表標(biāo)簽與分組標(biāo)識),不管是在同一數(shù)據(jù)庫中還是基于配有多種數(shù)據(jù)庫平臺的數(shù)據(jù)倉庫范圍內(nèi),對于某個(gè)特定的維度, 這些內(nèi)容都是一樣的。簡單來說,只要在數(shù)據(jù)層范圍內(nèi),不管
39、物理上部署了多少 個(gè)數(shù)據(jù)庫,不管什么應(yīng)用系統(tǒng),對于某個(gè)指定的維度,都具有相同的表結(jié)構(gòu)和相 同的數(shù)據(jù)。一致性維度作為一根總線,不僅使這些內(nèi)部系統(tǒng)能夠以一個(gè)統(tǒng)一的標(biāo)準(zhǔn)結(jié)合 在一起,還使所有基于數(shù)據(jù)平臺的外部系統(tǒng)能按照這根總線的標(biāo)準(zhǔn)插入其中,構(gòu)成一個(gè)總線矩陣,以實(shí)現(xiàn)數(shù)據(jù)層大平臺的概念。在設(shè)計(jì)一致性維度時(shí),不依賴、不照搬生產(chǎn)系統(tǒng)數(shù)據(jù)層中特定的表, 而是充 分考慮各個(gè)系統(tǒng)之間的差異,集成多個(gè)系統(tǒng)。1.3.3.2 基礎(chǔ)數(shù)據(jù)項(xiàng)體系標(biāo)準(zhǔn)通過抽象與歸納稅務(wù)領(lǐng)域中的各類憑證數(shù)據(jù)和大量常見的、公共的分析指標(biāo), 以數(shù)據(jù)層中經(jīng)過加工的各類事實(shí)數(shù)據(jù)為基礎(chǔ), 把這些憑證數(shù)據(jù)和分析指標(biāo)在數(shù)據(jù) 層面上定義為各種基礎(chǔ)數(shù)據(jù)項(xiàng),從而
40、形成稅務(wù)領(lǐng)域的基礎(chǔ)數(shù)據(jù)項(xiàng)體系, 為各類查 詢統(tǒng)計(jì)、分析評估、預(yù)警監(jiān)控等分析型應(yīng)用提供統(tǒng)一和標(biāo)準(zhǔn)的數(shù)據(jù)支撐。在業(yè)務(wù)層面,基礎(chǔ)數(shù)據(jù)項(xiàng)體系規(guī)范了不同分析型應(yīng)用之間的口徑描述,使得不同系統(tǒng)間對某個(gè)特定的分析指標(biāo)具有一致的定義,解決了同名不同義和同義不同名的情況。在數(shù)據(jù)層面,基礎(chǔ)數(shù)據(jù)項(xiàng)體系保證了不同子系統(tǒng)間分析結(jié)果的唯一性,解決了同一個(gè)分析指標(biāo)在不同系統(tǒng)間出現(xiàn)不同的分析結(jié)果、分析結(jié)果相互矛盾的情況。所有分析應(yīng)用系統(tǒng)對某些憑證數(shù)據(jù)的查詢和公共的分析指標(biāo)的利用都來源于統(tǒng)一的基礎(chǔ)數(shù)據(jù)項(xiàng)部分(當(dāng)然還會有其它非公共的數(shù)據(jù),這些非公共的數(shù)據(jù)從 數(shù)據(jù)層的其它部分獲取),保證了多子系統(tǒng)間分析口徑的一致性和數(shù)據(jù)的唯一性。
41、1.3.3.2.1基礎(chǔ)數(shù)據(jù)項(xiàng)的定義基礎(chǔ)數(shù)據(jù)項(xiàng)是對稅務(wù)系統(tǒng)內(nèi)各類常見的憑證數(shù)據(jù)和分析指標(biāo)在數(shù)據(jù)層面的 解釋和實(shí)現(xiàn)。例如,登記戶數(shù)、應(yīng)中報(bào)戶數(shù)、已申報(bào)戶數(shù)、稅收收入等。它包含 三個(gè)要素:1、口徑在業(yè)務(wù)上,用于規(guī)范基礎(chǔ)數(shù)據(jù)項(xiàng)的業(yè)務(wù)口徑, 使基礎(chǔ)數(shù)據(jù)項(xiàng)不是籠統(tǒng)的、模 糊的。在設(shè)計(jì)實(shí)現(xiàn)時(shí),用于明確每個(gè)基礎(chǔ)數(shù)據(jù)項(xiàng)進(jìn)行取數(shù)的事實(shí)表和表的字段, 以及取數(shù)時(shí)的限制條件等。2、維度維度用來確定基礎(chǔ)數(shù)據(jù)項(xiàng)的屬性,明確可以從哪些視角出發(fā)來分析某個(gè)特定 的基礎(chǔ)數(shù)據(jù)項(xiàng)。因?yàn)橐恢滦跃S度標(biāo)準(zhǔn)的建設(shè),所以基礎(chǔ)數(shù)據(jù)項(xiàng)體系中維度這個(gè)要 素保證了基礎(chǔ)數(shù)據(jù)項(xiàng)在不同應(yīng)用子系統(tǒng)之間的一致性, 使不同子系統(tǒng)間對同一個(gè) 基礎(chǔ)數(shù)據(jù)項(xiàng)、同一個(gè)維度的分析都能得到唯一的值。在基礎(chǔ)數(shù)據(jù)項(xiàng)體系中,與它關(guān)系密切的一致性維度包括:(1)稅務(wù)機(jī)構(gòu)稅務(wù)機(jī)構(gòu)維用于確定某個(gè)基礎(chǔ)數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年三方合作合同協(xié)議書:金融科技項(xiàng)目合作框架協(xié)議3篇
- 2024年度河砂開采權(quán)有償使用合同2篇
- 2024年度高品質(zhì)碎石供應(yīng)商買賣合同版B版
- 2024年農(nóng)業(yè)機(jī)械融資租賃合同2篇
- 2024年度片石石材加工與環(huán)保安全合同3篇
- 2024年度油田鉆探與打井降水一體化施工服務(wù)合同3篇
- 2024年度金融服務(wù)合同:銀行為中小企業(yè)提供融資支持3篇
- 2024年度商鋪委托出租合同包括商業(yè)品牌入駐及推廣3篇
- 2024年某科技公司與某運(yùn)營商關(guān)于5G網(wǎng)絡(luò)建設(shè)的合同
- 黃沙材料采購合同范例
- 藥品養(yǎng)護(hù)匯總分析報(bào)表
- 中醫(yī)藥申報(bào)書
- 不穩(wěn)定型心絞痛臨床路徑表單
- 化肥的發(fā)展史
- 水運(yùn)工程施工組織設(shè)計(jì)
- 斑蝥的藥用價(jià)值與養(yǎng)殖
- 三維激光掃描技術(shù)與應(yīng)用實(shí)例(課堂PPT)
- 消防水池施工方案
- 小學(xué)美術(shù)《多變的紙拉花》課件ppt課件
- 《數(shù)據(jù)結(jié)構(gòu)》課程標(biāo)準(zhǔn)
- 譯林版五年級上冊英語五上《朗文閱讀》U1-2練習(xí)題
評論
0/150
提交評論