最新大數(shù)據(jù)與云計(jì)算(精編版)_第1頁
最新大數(shù)據(jù)與云計(jì)算(精編版)_第2頁
最新大數(shù)據(jù)與云計(jì)算(精編版)_第3頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、大數(shù)據(jù)與云計(jì)算.精品資料大數(shù)據(jù)與云計(jì)算摘要: 大數(shù)據(jù)( big data)這個(gè)概念近年來在越來越多的場(chǎng)合、被越來越多的人提及,并且經(jīng)常和云計(jì)算聯(lián)系在一起,云計(jì)算與大數(shù)據(jù)之間到底是什么關(guān)系成為熱點(diǎn)話題。本專題報(bào)告包含以下四個(gè)方面內(nèi)容:1.大數(shù)據(jù)的價(jià)值; 2.大數(shù)據(jù)帶來的挑戰(zhàn) ;3.大數(shù)據(jù)研究成果; 4.云計(jì)算是大數(shù)據(jù)挖掘的主流方式。通過本報(bào)告闡述我們對(duì)大數(shù)據(jù)的理解,以及對(duì)大數(shù)據(jù)的價(jià)值的認(rèn)識(shí),探討大數(shù)據(jù)處理與挖掘技術(shù),大數(shù)據(jù)主要著眼于“數(shù)據(jù)”,提供數(shù)據(jù)采集、挖 掘、分析的技術(shù)和方法 ;云計(jì)算技術(shù)主要關(guān)注“計(jì)算”, 提供it解決方案。大數(shù)據(jù)、云計(jì)算技術(shù)可以促進(jìn)持續(xù)審 計(jì)方式的發(fā)展、總體審計(jì)模式的應(yīng)用

2、、審計(jì)成果的綜合應(yīng)用、相關(guān)關(guān)系證據(jù)的應(yīng)用、高效數(shù)據(jù)審計(jì)的發(fā)展和大數(shù)據(jù)審計(jì)師的發(fā)展。強(qiáng)化大數(shù)據(jù)、云計(jì)算技術(shù)審計(jì)應(yīng)用的措施包括制定長遠(yuǎn)發(fā)展戰(zhàn)略、加快審計(jì)法規(guī)建設(shè)、建立行業(yè)平臺(tái)、加強(qiáng)研發(fā)和提高利用能力。關(guān)鍵詞:大數(shù)據(jù)云計(jì)算數(shù)據(jù)挖掘?qū)徲?jì)影響政策建議引言目前,大數(shù)據(jù)伴隨著云計(jì)算技術(shù)的發(fā)展,正在對(duì)全球經(jīng)濟(jì)社會(huì)生活產(chǎn)生巨大的影響。大數(shù)據(jù)、云計(jì)算技術(shù)給現(xiàn).精品資料代審計(jì)提供了新的技術(shù)和方法,要求審計(jì)組織和審計(jì)人員把握大數(shù)據(jù)、云計(jì)算技術(shù)的內(nèi)容與特征,促進(jìn)現(xiàn)代審計(jì)技術(shù)和方法的進(jìn)一步發(fā)展。一、大數(shù)據(jù)、云計(jì)算的涵義與特征隨著云計(jì)算技術(shù)的出現(xiàn),大數(shù)據(jù)吸引了全世界越來越多的關(guān)注。哈佛大學(xué)社會(huì)學(xué)教授加里·金(

3、2012)說:“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程。”(一)大數(shù)據(jù)的涵義與特征“數(shù)據(jù)” ( data)這個(gè)詞在拉丁文里是“已知”的意思,也可以理解為“事實(shí)”。2009年,“大數(shù)據(jù)”概念才逐漸開始在社會(huì)上傳播。而“大數(shù)據(jù)”概念真正變得火爆,卻是因?yàn)槊绹鴬W巴馬政府在2012年高調(diào)宣布了其 “大數(shù)據(jù)研究和開發(fā)計(jì)劃”。這標(biāo)志著“大數(shù)據(jù)”時(shí)代真正開始進(jìn)入社會(huì)經(jīng)濟(jì)生活中來了?!按髷?shù)據(jù)”( big data),或稱巨量資料,指的是所涉及的數(shù)據(jù)量規(guī)模大到無法利用現(xiàn)行主流軟件工具,在一定的時(shí)間內(nèi)實(shí)現(xiàn)收集、分析、處理或轉(zhuǎn)化成為幫助決策者決策的

4、可用信息?;ヂ?lián)網(wǎng)數(shù)據(jù)中心 ( idc)認(rèn)為“大數(shù)據(jù)”是為了更經(jīng)濟(jì)、更有效地從高頻率、大容量、不同結(jié)構(gòu)和類型的數(shù)據(jù)中獲取價(jià)值而設(shè)計(jì)的新一代架構(gòu)和技術(shù),用它來描述和定義信息爆炸.精品資料時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。大數(shù)據(jù)具有 4個(gè)特點(diǎn):第一,數(shù)據(jù)體量巨大( volume),從tb 級(jí)別躍升到 pb 級(jí)別。第二,處理速度快( velocity),這與傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不 同。第三,數(shù)據(jù)種類多 ( variety),有圖片、地理位置信息、視頻、網(wǎng)絡(luò)日志等多種形式。第四,價(jià)值密度低, 商業(yè)價(jià)值高 ( value)。存在單一數(shù)據(jù)的價(jià)值并不大,但 將相關(guān)數(shù)據(jù)聚集在一起,就會(huì)

5、有很高的商業(yè)價(jià)值(金良, 2012)。大數(shù)據(jù)時(shí)代,不僅改變了傳統(tǒng)的數(shù)據(jù)采集、處理 和應(yīng)用技術(shù)與方法,還促使人們思維方式的改變。大數(shù)據(jù) 的精髓在于促使人們?cè)诓杉?、處理和使用?shù)據(jù)時(shí)思維的轉(zhuǎn) 變,這些轉(zhuǎn)變將改變?nèi)藗兝斫夂脱芯可鐣?huì)經(jīng)濟(jì)現(xiàn)象的技術(shù) 和方法。(1) 是在大數(shù)據(jù)時(shí)代,不依賴抽樣分析,而可以采集和處理事物整體的全部數(shù)據(jù)。19世紀(jì)以來,當(dāng)面臨大的樣本量時(shí),人們都主要依靠抽樣來分析總體。但是,抽樣技術(shù)是在數(shù)據(jù)缺乏和取得數(shù)據(jù)受限制的條件下不得不采用的一種方法,這其實(shí)是一種人為的限制。過去,因?yàn)橛?錄、儲(chǔ)存和分析數(shù)據(jù)的工具不夠科學(xué),只能收集少量數(shù)據(jù)進(jìn)行分析。如今,科學(xué)技術(shù)條件已經(jīng)有了很大的提高,雖然人

6、類可以處理的數(shù)據(jù)依然是有限的,但是可以處理的數(shù)據(jù)量已經(jīng)大量增加,而且未來會(huì)越來越多。隨著大數(shù)據(jù)分.精品資料析取代抽樣分析,社會(huì)科學(xué)不再單純依賴于抽樣調(diào)查和分析實(shí)證數(shù)據(jù),現(xiàn)在可以收集過去無法收集到的數(shù)據(jù),更重要的是,現(xiàn)在可以不再依賴抽樣分析。(2) 是在大數(shù)據(jù)時(shí)代,不再熱衷于追求數(shù)據(jù)的精確 度,而是追求利用數(shù)據(jù)的效率。當(dāng)測(cè)量事物的能力受限制時(shí),關(guān)注的是獲取最精確的結(jié)果。但是,在大數(shù)據(jù)時(shí)代, 追求精確度已經(jīng)既無必要又不可行,甚至變得不受歡迎。大數(shù)據(jù)紛繁多樣,優(yōu)劣摻雜,精準(zhǔn)度已不再是分析事物總體的主要手段。擁有了大數(shù)據(jù),不再需要對(duì)一個(gè)事物的現(xiàn)象深究,只要掌握事物的大致發(fā)展趨勢(shì)即可,更重要的是追求數(shù)據(jù)

7、的及時(shí)性和使用效率。與依賴于小數(shù)據(jù)和精確性的時(shí)代相比較,大數(shù)據(jù)更注重?cái)?shù)據(jù)的完整性和混雜性,幫助人們進(jìn)一步認(rèn)識(shí)事物的全貌和真相。(3) 是在大數(shù)據(jù)時(shí)代,人們難以尋求事物直接的因果關(guān)系,而是深入認(rèn)識(shí)和利用事物的相關(guān)關(guān)系。長期以來, 尋找因果關(guān)系是人類發(fā)展過程中形成的傳統(tǒng)習(xí)慣。尋求因果關(guān)系即使很困難且用途不大,但人們無法擺脫認(rèn)識(shí)的傳統(tǒng)思維。在大數(shù)據(jù)時(shí)代,人們不必將主要精力放在事物之間因果關(guān)系的分析上,而是將主要精力放在尋找事物之間的相關(guān)關(guān)系上。事物之間的相關(guān)關(guān)系可能不會(huì)準(zhǔn)確地告知事物發(fā)生的內(nèi)在原因,但是它會(huì)提醒人們事情之間的相互.精品資料聯(lián)系。人們可以通過找到一個(gè)事物的良好相關(guān)關(guān)系,幫助其捕捉到事物

8、的現(xiàn)在和預(yù)測(cè)未來。(二)云計(jì)算的涵義與特征“云計(jì)算”概念產(chǎn)生于谷歌和ibm 等大型互聯(lián)網(wǎng)公司處理海量數(shù)據(jù)的實(shí)踐。 2006年8月9日, google首席執(zhí)行官埃里克·施密特 ( eric schmidt)在搜索引擎大會(huì)首次提出“云計(jì)算”的概念。2007年10月, google與ibm 開始在美國大學(xué)校園推廣云計(jì)算技術(shù)的計(jì)劃,這項(xiàng)計(jì)劃希 望能降低分布式計(jì)算技術(shù)在學(xué)術(shù)研究方面的成本,并為這 些大學(xué)提供相關(guān)的軟硬件設(shè)備及技術(shù)支持( michaelmille,2009)。目前全世界關(guān)于“云計(jì)算”的定義有很 多。“云計(jì)算”是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和 交付模式,是通過互聯(lián)網(wǎng)來提供動(dòng)態(tài)易

9、擴(kuò)展且經(jīng)常是虛擬 化的資源。美國國家標(biāo)準(zhǔn)技術(shù)研究院( nist) 2009年關(guān)于云計(jì)算的定義是 :“云計(jì)算是一種按使用量付費(fèi)的模式, 這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問,進(jìn)入可 配置的計(jì)算資源共享池 (資源包括網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用軟件、服務(wù)等 ),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進(jìn)行很少的交互。” 根據(jù)這一定義,云計(jì)算的特征主要表現(xiàn)為:首先,云計(jì)算是一種計(jì)算模式,具有時(shí)間和網(wǎng)絡(luò)存儲(chǔ)的功能。其次,云 計(jì)算是一條接入路徑,通過廣泛接入網(wǎng)絡(luò)以獲取計(jì)算能.精品資料力,通過標(biāo)準(zhǔn)機(jī)制進(jìn)行訪問。第三,云計(jì)算是一個(gè)資源 池,云計(jì)算服務(wù)提供商的計(jì)算資源,通過多租戶模式為

10、不同用戶提供服務(wù),并根據(jù)用戶的需求動(dòng)態(tài)提供不同的物理的或虛擬的資源。第四,云計(jì)算是一系列伸縮技術(shù),在信息化和互聯(lián)網(wǎng)環(huán)境下的計(jì)算規(guī)??梢钥焖贁U(kuò)大或縮小,計(jì)算能力可以快速、彈性獲得。第五,云計(jì)算是一項(xiàng)可計(jì)量的服務(wù),云計(jì)算資源的使用情況可以通過云計(jì)算系統(tǒng)檢 測(cè)、控制、計(jì)量,以自動(dòng)控制和優(yōu)化資源使用。(三)大數(shù)據(jù)與云計(jì)算的關(guān)系從整體上看,大數(shù)據(jù)與云計(jì)算是相輔相成的。大數(shù)據(jù) 主要專注實(shí)際業(yè)務(wù),著眼于“數(shù)據(jù)”,提供數(shù)據(jù)采集、挖 掘、分析的技術(shù)和方法,強(qiáng)調(diào)的是數(shù)據(jù)存儲(chǔ)能力。云計(jì)算 主要關(guān)注“計(jì)算”,關(guān)注it架構(gòu),提供 it解決方案,強(qiáng)調(diào)的是計(jì)算能力,即數(shù)據(jù)處理能力。如果沒有大數(shù)據(jù)的數(shù) 據(jù)存儲(chǔ),那么云計(jì)算的計(jì)

11、算能力再強(qiáng)大,也難以找到用武 之地;如果沒有云計(jì)算的數(shù)據(jù)處理能力,則大數(shù)據(jù)的數(shù)據(jù) 存儲(chǔ)再豐富,也終究難以用于實(shí)踐中去。從技術(shù)上看,大數(shù)據(jù)依賴于云計(jì)算。海量數(shù)據(jù)存儲(chǔ)技術(shù)、海量數(shù)據(jù)管理技術(shù)、mapeduce編程模型都是云計(jì)算的關(guān)鍵技術(shù),也都是大數(shù)據(jù)的技術(shù)基礎(chǔ)。而數(shù)據(jù)之所以會(huì)變“大”,最重要的便是云計(jì)算提供的技術(shù)平臺(tái)。數(shù)據(jù)被放到“云”上之后,打破了過去那種各自分割的數(shù)據(jù)存.精品資料儲(chǔ),更容易被收集和獲得,大數(shù)據(jù)才能呈現(xiàn)在人們眼前。而巨量的數(shù)據(jù)也只能依靠云計(jì)算強(qiáng)大的數(shù)據(jù)處理能力,才能夠“淘盡黃沙始得金”。從側(cè)重點(diǎn)看,大數(shù)據(jù)與云計(jì)算的側(cè)重點(diǎn)不同。大數(shù)據(jù)的側(cè)重點(diǎn)是各種數(shù)據(jù),廣泛、深入挖掘巨量數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)

12、中的價(jià)值,迫使企業(yè)從“業(yè)務(wù)驅(qū)動(dòng)”轉(zhuǎn)變?yōu)椤皵?shù)據(jù)驅(qū) 動(dòng)”。而云計(jì)算主要通過互聯(lián)網(wǎng)廣泛獲取、擴(kuò)展和管理計(jì)算及存儲(chǔ)資源和能力,其側(cè)重點(diǎn)是it資源、處理能力和各種應(yīng)用,以幫助企業(yè)節(jié)省it 部署成本。云計(jì)算使企業(yè)的it部門受益,而大數(shù)據(jù)使企業(yè)的業(yè)務(wù)管理部門受益。從結(jié)果看,大數(shù)據(jù)與云計(jì)算帶來不同的變化。大數(shù)據(jù)對(duì)社會(huì)經(jīng)濟(jì)帶來的變化是巨大的,涉及到各個(gè)領(lǐng)域。大數(shù)據(jù)已經(jīng)與資本、人力一起作為生產(chǎn)的主要因素影響著社會(huì)經(jīng)濟(jì)的發(fā)展。數(shù)據(jù)創(chuàng)造價(jià)值,而挖掘數(shù)據(jù)價(jià)值、利用數(shù)據(jù)的“推動(dòng)力”就是云計(jì)算。云計(jì)算將信息存儲(chǔ)、分享和挖掘能力極大提高,更經(jīng)濟(jì)、高效地將巨量、高速、多變的終端數(shù)據(jù)存儲(chǔ)下來,并隨時(shí)進(jìn)行計(jì)算與分析。通過云計(jì)算對(duì)大

13、數(shù)據(jù)進(jìn)行分析、總結(jié)與預(yù)測(cè),會(huì)使得決策更可靠,釋放出更多大數(shù)據(jù)的內(nèi)在價(jià)值。二、大數(shù)據(jù)、云計(jì)算技術(shù)對(duì)審計(jì)的影響分析審計(jì)技術(shù)和方法的發(fā)展是隨著科學(xué)和管理技術(shù)的發(fā)展而發(fā)展的?,F(xiàn)代審計(jì)技術(shù)和方法體系是在原始的查賬基礎(chǔ).精品資料上從低級(jí)向高級(jí)、從不完備到比較完備發(fā)展起來的。在業(yè) 務(wù)和會(huì)計(jì)處理手工操作階段,審計(jì)實(shí)施的是賬表導(dǎo)向的審 計(jì)技術(shù)和方法 ;當(dāng)內(nèi)部控制理論和方法全面應(yīng)用于業(yè)務(wù)和會(huì)計(jì)處理時(shí),審計(jì)實(shí)施的是系統(tǒng)導(dǎo)向的審計(jì)技術(shù)和方法; 當(dāng)風(fēng)險(xiǎn)管理理論和方法全面應(yīng)用于業(yè)務(wù)和財(cái)務(wù)管理時(shí),審 計(jì)實(shí)施的是風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)技術(shù)和方法;與風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)技術(shù)和方法并行的是,計(jì)算機(jī)技術(shù)廣泛應(yīng)用于業(yè)務(wù)和會(huì)計(jì)處 理時(shí),審計(jì)實(shí)施的是 i

14、t審計(jì)技術(shù)和方法。目前,面對(duì)大 數(shù)據(jù)、云計(jì)算技術(shù)的產(chǎn)生和發(fā)展,審計(jì)人員需要應(yīng)時(shí)而變 來適應(yīng)由此而帶來的變化,分析大數(shù)據(jù)、云計(jì)算技術(shù)對(duì)審 計(jì)方式、審計(jì)抽樣技術(shù)、審計(jì)報(bào)告模式、審計(jì)證據(jù)搜集等 技術(shù)和方法的影響。(一)大數(shù)據(jù)、云計(jì)算技術(shù)促進(jìn)持續(xù)審計(jì)方式的發(fā)展傳統(tǒng)審計(jì)中,審計(jì)人員只是在被審計(jì)單位業(yè)務(wù)完成后才進(jìn)行審計(jì),而且審計(jì)過程中并不是審計(jì)所有的數(shù)據(jù)和信息,只是抽取其中有的一部分進(jìn)行審計(jì)。這種事后和有限的審計(jì)對(duì)被審計(jì)單位復(fù)雜的生產(chǎn)經(jīng)營和管理系統(tǒng)來說很難及時(shí)做出正確的評(píng)價(jià),而且對(duì)于評(píng)價(jià)日益頻繁和復(fù)雜的經(jīng)營管理活動(dòng)的真實(shí)性和合法性則顯得過于遲緩。隨著信息技術(shù)迅速發(fā)展,越來越多的審計(jì)組織對(duì)被審計(jì)單位開始實(shí)施

15、持續(xù)審計(jì)方式,以解決審計(jì)結(jié)果與經(jīng)濟(jì)活動(dòng)的時(shí)差問 題。但是,審計(jì)人員實(shí)施持續(xù)審計(jì)時(shí),往往受目前業(yè)務(wù)條.精品資料件和信息化手段的限制,取得的非結(jié)構(gòu)化數(shù)據(jù)無法數(shù)據(jù) 化,或者無法取得相關(guān)的明細(xì)數(shù)據(jù),致使對(duì)問題的判斷也難以進(jìn)一步具體和深入。而大數(shù)據(jù)、云計(jì)算技術(shù)可以促進(jìn)持續(xù)審計(jì)方式的發(fā)展,使信息技術(shù)與大數(shù)據(jù)、云計(jì)算技術(shù)較好交叉融合,尤其對(duì)業(yè)務(wù)數(shù)據(jù)和風(fēng)險(xiǎn)控制“實(shí)時(shí)性”要求較高的特定行業(yè),如銀行、證券、保險(xiǎn)等行業(yè),在這些行業(yè)中實(shí)施持續(xù)審計(jì)迫在眉睫。如審計(jì)組織對(duì)商業(yè)銀行的審計(jì),實(shí)行與商業(yè)銀行建立業(yè)務(wù)和數(shù)據(jù)系統(tǒng)的接口,在開發(fā)的持續(xù)審計(jì)系統(tǒng)中固化了非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化和數(shù)據(jù)分析模塊,該模塊可以在海量貸款客戶中挖掘、分

16、析出行業(yè)性和區(qū)域性貸款風(fēng)險(xiǎn)趨勢(shì),實(shí)現(xiàn)在線的風(fēng)險(xiǎn)預(yù)警,并將發(fā)現(xiàn)的風(fēng)險(xiǎn)數(shù)據(jù)、超預(yù)警值指標(biāo)及問題登記為疑點(diǎn),并建立實(shí)時(shí)審計(jì)工作底稿,按照重要程度進(jìn)行歸類、核實(shí)或下發(fā)給現(xiàn)場(chǎng)審計(jì)人員進(jìn)行現(xiàn)場(chǎng)核實(shí),以較好處理非結(jié)構(gòu)化數(shù)據(jù)的利用和數(shù)據(jù)的實(shí)時(shí)分析利用問題。(二)大數(shù)據(jù)、云計(jì)算技術(shù)促進(jìn)總體審計(jì)模式的應(yīng)用現(xiàn)時(shí)的審計(jì)模式是在評(píng)價(jià)被審計(jì)單位風(fēng)險(xiǎn)基礎(chǔ)上實(shí)施抽樣審計(jì)。在不可能收集和分析被審計(jì)單位全部經(jīng)濟(jì)業(yè)務(wù)數(shù)據(jù)的情況下,現(xiàn)時(shí)的審計(jì)模式主要依賴于審計(jì)抽樣,從局部入手推斷整體,即從抽取的樣本著手進(jìn)行審計(jì),再據(jù)此推斷審計(jì)對(duì)象的整體情況。這種抽樣審計(jì)模式,由于抽取樣本的有限性,而忽視了大量和具體的業(yè)務(wù)活動(dòng),使審.精品資料計(jì)人員無

17、法完全發(fā)現(xiàn)和揭示被審計(jì)單位的重大舞弊行為, 隱藏著重大的審計(jì)風(fēng)險(xiǎn)。而大數(shù)據(jù)、云計(jì)算技術(shù)對(duì)審計(jì)人員而言,不僅僅是一種可供采用的技術(shù)手段,這些技術(shù)和方法將給審計(jì)人員提供實(shí)施總體審計(jì)模式的可行性。利用大數(shù)據(jù)、云計(jì)算技術(shù),對(duì)數(shù)據(jù)的跨行業(yè)、跨企業(yè)搜集和分析,可以不用隨機(jī)抽樣方法,而采用搜集和分析被審計(jì)單位所有數(shù)據(jù)的總體審計(jì)模式。利用大數(shù)據(jù)、云計(jì)算技術(shù)的總體審計(jì)模式是要分析與審計(jì)對(duì)象相關(guān)的所有數(shù)據(jù),使得審計(jì)人員可以建立總體審計(jì)的思維模式,可以使現(xiàn)代審計(jì)獲得革命性的變化。審計(jì)人員實(shí)施總體審計(jì)模式,可以規(guī)避審計(jì)抽樣風(fēng)險(xiǎn)。如果能夠收集總體的所有數(shù)據(jù),就能看到更細(xì)微、深入的信息,對(duì)數(shù)據(jù)進(jìn)行多角度的深層次分 析,從

18、而發(fā)現(xiàn)隱藏在細(xì)節(jié)數(shù)據(jù)中的對(duì)審計(jì)問題更具價(jià)值的信息。同時(shí),審計(jì)人員實(shí)施總體審計(jì)模式,能發(fā)現(xiàn)從審計(jì)抽樣模式所不能發(fā)現(xiàn)的問題。大數(shù)據(jù)、云計(jì)算技術(shù)給審計(jì)人員提供了一種能夠從總體把握審計(jì)對(duì)象的技術(shù)手段,從而幫助審計(jì)人員能從總體的視角發(fā)現(xiàn)以前難以發(fā)現(xiàn)的問 題。(三)大數(shù)據(jù)、云計(jì)算技術(shù)促進(jìn)審計(jì)成果的綜合應(yīng)用 目前,審計(jì)人員的審計(jì)成果主要是提供給被審計(jì)單位的審計(jì)報(bào)告,其格式固定,內(nèi)容單一,包含的信息量較少。隨著大數(shù)據(jù)、云計(jì)算技術(shù)在審計(jì)中廣泛應(yīng)用,審計(jì)人.精品資料員的審計(jì)成果除了審計(jì)報(bào)告外,還有在審計(jì)過程中采集、挖掘、分析和處理的大量的資料和數(shù)據(jù),可以提供給被審計(jì)單位用于改進(jìn)經(jīng)營管理,促進(jìn)審計(jì)成果的綜合應(yīng)用,提

19、高審計(jì)成果的綜合應(yīng)用效果。首先,審計(jì)人員通過對(duì)審計(jì)中獲取的大量數(shù)據(jù)和相關(guān)情況資料的匯總、歸納,從中找出財(cái)務(wù)、業(yè)務(wù)和經(jīng)營管理等方面的內(nèi)在規(guī)律、共性問題和發(fā)展趨勢(shì),通過匯總歸納宏觀性和綜合性較強(qiáng)的審計(jì)信 息,為被審計(jì)單位投資者和其他利益相關(guān)者提供數(shù)據(jù)證 明、關(guān)聯(lián)分析和決策建議,從而促進(jìn)被審計(jì)單位管理水平的提高。其次,審計(jì)人員通過應(yīng)用大數(shù)據(jù)、云計(jì)算技術(shù), 可以將同一問題歸入不同的類別進(jìn)行分析和處理,從不同的角度、不同的層面整合提煉以滿足不同層次的需求。再次,審計(jì)人員將審計(jì)成果進(jìn)行智能化留存,通過大數(shù)據(jù)、云計(jì)算技術(shù),將問題規(guī)則化并固化到系統(tǒng)中,以便于計(jì)算或判斷問題發(fā)展趨勢(shì),向被審計(jì)單位進(jìn)行預(yù)警。最后。

20、審計(jì)人員將審計(jì)成果、被審計(jì)單位與審計(jì)問題進(jìn)行關(guān)聯(lián),并進(jìn)行信息化處理,在進(jìn)行下次審計(jì)時(shí),減少實(shí)地審計(jì)的時(shí)間和工作量,提高審計(jì)工作的效率。(四)大數(shù)據(jù)、云計(jì)算技術(shù)促進(jìn)相關(guān)關(guān)系證據(jù)的應(yīng)用 審計(jì)人員在審計(jì)過程中,應(yīng)根據(jù)充分、適當(dāng)?shù)膶徲?jì)證據(jù)發(fā)表審計(jì)意見,出具審計(jì)報(bào)告。但是,在大數(shù)據(jù)、云計(jì)算環(huán)境下,審計(jì)人員既面臨巨量數(shù)據(jù)篩選的考驗(yàn),又面臨.精品資料搜集適當(dāng)審計(jì)證據(jù)的挑戰(zhàn)。審計(jì)人員在搜集審計(jì)證據(jù)時(shí), 傳統(tǒng)的思維路徑都是基于因果關(guān)系來搜集審計(jì)證據(jù),而大 數(shù)據(jù)分析將會(huì)更多地運(yùn)用相關(guān)關(guān)系分析來搜集和發(fā)現(xiàn)審計(jì) 證據(jù)。但從審計(jì)證據(jù)發(fā)現(xiàn)的角度來看,由于大數(shù)據(jù)技術(shù)提 供了前所未有的跨領(lǐng)域、可供量化的維度,使得審計(jì)問題 大

21、量的相關(guān)信息能夠得以記錄和計(jì)算分析。大數(shù)據(jù)、云計(jì) 算技術(shù)沒有改變事物間的因果關(guān)系,但在大數(shù)據(jù)、云計(jì)算 技術(shù)中對(duì)相關(guān)關(guān)系的開發(fā)和利用,使得數(shù)據(jù)分析對(duì)因果邏 輯關(guān)系的依賴降低了,甚至更多地傾向于應(yīng)用基于相關(guān)關(guān) 系的數(shù)據(jù)分析,以相關(guān)關(guān)系分析為基礎(chǔ)的驗(yàn)證是大數(shù)據(jù)、 云計(jì)算技術(shù)的一項(xiàng)重要特征。在大數(shù)據(jù)、云計(jì)算技術(shù)環(huán)境 下,審計(jì)人員能搜集到的審計(jì)證據(jù)大多是電子證據(jù)(秦榮生, 2013)。電子證據(jù)本身就非常復(fù)雜,云計(jì)算技術(shù)使獲 取有因果關(guān)系的證據(jù)更加困難。審計(jì)人員應(yīng)從長期依賴因 果關(guān)系來搜集和發(fā)現(xiàn)審計(jì)證據(jù),轉(zhuǎn)變成為利用相關(guān)關(guān)系來 搜集和發(fā)現(xiàn)審計(jì)證據(jù)。(五)大數(shù)據(jù)、云計(jì)算技術(shù)促進(jìn)高效數(shù)據(jù)審計(jì)的發(fā)展 直到今天,

22、審計(jì)人員的數(shù)字審計(jì)技術(shù)依然建立在精準(zhǔn)的基礎(chǔ)上。這種思維方式適用于掌握“小數(shù)據(jù)量”的情 況,因?yàn)樾枰治龅臄?shù)據(jù)很少,所以審計(jì)人員必須盡可能精準(zhǔn)地量化被審計(jì)單位的業(yè)務(wù)。隨著大數(shù)據(jù)、云計(jì)算技術(shù)成為日常生活中的一部分,審計(jì)人員應(yīng)開始從一個(gè)比以前.精品資料更大、更全面的角度來理解被審計(jì)單位,將“樣本=總體”植入審計(jì)人員的思維中。相比依賴于小數(shù)據(jù)和精確性的時(shí)代,大數(shù)據(jù)更強(qiáng)調(diào)數(shù)據(jù)的完整性和混雜性,幫助審計(jì)人員進(jìn)一步接近事情的真相,“局部”和“精確”將不再是審計(jì)人員追求的目標(biāo),審計(jì)人員追求的是事物的“全 貌”和“高效”。圍繞大數(shù)據(jù),一批新興的數(shù)據(jù)挖掘、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理與分析技術(shù)將不斷涌現(xiàn)。在實(shí)施審計(jì) 時(shí),審

23、計(jì)人員應(yīng)利用大數(shù)據(jù)、云計(jì)算技術(shù),使用分布式拓樸結(jié)構(gòu)、云數(shù)據(jù)庫、聯(lián)網(wǎng)審計(jì)、數(shù)據(jù)挖掘等新型的技術(shù)手段和工具,以提高審計(jì)的效率。(六)大數(shù)據(jù)、云計(jì)算技術(shù)促進(jìn)大數(shù)據(jù)審計(jì)師的發(fā)展大數(shù)據(jù)、云計(jì)算時(shí)代,數(shù)據(jù)的真實(shí)、可靠是大數(shù)據(jù)發(fā)揮作用的前提。這客觀上要求專業(yè)人員來對(duì)大數(shù)據(jù)的真實(shí)性、可靠性進(jìn)行鑒證,審計(jì)人員可以扮演這種角色,或者稱為數(shù)據(jù)審計(jì)師。能對(duì)大數(shù)據(jù)真實(shí)性、可靠性進(jìn)行鑒證的數(shù)據(jù)審計(jì)師應(yīng)該是計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)和審計(jì)學(xué)領(lǐng)域的專家,他們應(yīng)有大數(shù)據(jù)分析和預(yù)測(cè)的評(píng)估能力。數(shù)據(jù)審計(jì)師應(yīng)恪守公正的立場(chǎng)和嚴(yán)守保密的原則,面對(duì)海量的數(shù)據(jù)和紛繁復(fù)雜的相關(guān)關(guān)系,選取分析和預(yù)測(cè)工具,以及解讀數(shù)據(jù)及數(shù)據(jù)計(jì)算結(jié)果是否真實(shí)、可靠

24、。一旦出現(xiàn)爭 議,數(shù)據(jù)審計(jì)師有權(quán)審查與分析結(jié)果相關(guān)的運(yùn)算法則、統(tǒng)計(jì)方法以及數(shù)據(jù)采集、挖掘和處理過程。數(shù)據(jù)審計(jì)師的出.精品資料現(xiàn)是為滿足以市場(chǎng)為導(dǎo)向來解決數(shù)據(jù)真實(shí)性、可靠性問題的需求,這與 20 世紀(jì)初期為了處理財(cái)務(wù)信息虛假而出現(xiàn)的審計(jì)人員一樣,都是為了滿足新需求而出現(xiàn)的。三、大數(shù)據(jù)挖掘數(shù)據(jù)的價(jià)值只有通過數(shù)據(jù)挖掘才能從低價(jià)值密度的數(shù)據(jù)中發(fā)現(xiàn)其潛在價(jià)值,而大數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)離不開云計(jì)算技術(shù)。在業(yè)界,全球著名的google、emc、惠普、 ibm、微軟等互聯(lián)網(wǎng)公司都已經(jīng)意識(shí)到大數(shù)據(jù)挖掘的重要 意義。上述 it巨頭們紛紛通過收購大數(shù)據(jù)分析公司,進(jìn) 行技術(shù)整合,希望從大數(shù)據(jù)中挖掘更多的商業(yè)價(jià)值。數(shù)據(jù)挖

25、掘通常需要遍歷訓(xùn)練數(shù)據(jù)獲得相關(guān)的統(tǒng)計(jì)信息,用于求解或優(yōu)化模型參數(shù),在大規(guī)模數(shù)據(jù)上進(jìn)行頻繁的數(shù)據(jù)訪問需要耗費(fèi)大量運(yùn)算時(shí)間。數(shù)據(jù)挖掘領(lǐng)域長期受益于并行算法和架構(gòu)的使用,使得性能逐漸提升。過去15年來,效果尤其顯著。試圖將這些進(jìn)步結(jié)合起來,并且提煉。gpu 平臺(tái)從并行上得到的性能提升十分顯著。這些gpu平臺(tái)由于采用并行架構(gòu),使用并行編程方法,使得計(jì)算能力呈幾 何級(jí)數(shù)增長。即便是圖形處理、游戲編程是公認(rèn)的復(fù)雜, 它們也從并行化受益頗多。研究顯示數(shù)據(jù)挖掘、圖遍歷、 有限狀態(tài)機(jī)是并行化未來的熱門方向。mapreduce框架已經(jīng)被證明是提升 gpu運(yùn)行數(shù)據(jù)挖掘算法性能的重要工具。d.luo等提出一種非平凡的

26、策略用來并行一系列數(shù)據(jù)挖掘.精品資料與數(shù)據(jù)挖掘問題,包括一類分類svm和兩類分類 svm,非負(fù)最小二乘問題,及 l1正則化回歸( lasso )問題。由此得到的乘法算法,可以被直截了當(dāng)?shù)卦谌鏼apreduce和cuda的并行計(jì)算環(huán)境中實(shí)現(xiàn)。k. shim在mapreduce框架下,討論如何設(shè)計(jì)高 mapreduce算法,對(duì)當(dāng)前一些基于mapreduce的數(shù)據(jù)挖掘和數(shù)據(jù)挖掘算法進(jìn)行歸納總結(jié),以 便進(jìn)行大數(shù)據(jù)的分析。 junbo zhang等提出一種新的大數(shù)據(jù)挖掘技術(shù),即利用 mapredue實(shí)現(xiàn)并行的基于粗糙集的知識(shí)獲取算法,還提出了下一步的研究方向,即集中于用 基于并行技術(shù)的粗糙集算法處理非結(jié)

27、構(gòu)化數(shù)據(jù)。f.gao提出了一種新的近似算法使基于核的數(shù)據(jù)挖掘算法可以有效 的處理大規(guī)模數(shù)據(jù)集。當(dāng)前的基于核的數(shù)據(jù)挖掘算法由于 需要計(jì)算核矩陣面臨著可伸縮性問題,計(jì)算核矩陣需要o( n2 )的時(shí)間和空間復(fù)雜度來計(jì)算和存儲(chǔ)。該算法計(jì)算 核矩陣時(shí)大幅度降低計(jì)算和內(nèi)存開銷,而且并沒有明顯影響結(jié)果的精確度。此外,通過折中結(jié)果的一些精度可以控制近似水平。它獨(dú)立于隨后使用的數(shù)據(jù)挖掘算法并且可以被它們使用。為了闡明近似算法的效果,在其上開發(fā)了一個(gè)變種的譜聚類算法,此外設(shè)計(jì)了一個(gè)所提出算法的基于mapreduce的實(shí)現(xiàn)。在合成和真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示,所提出的算法可以獲得顯著的時(shí)間和空間節(jié)省。christi

28、an kaiser等還利用 mapreduce框架分布式實(shí)現(xiàn).精品資料了訓(xùn)練一系列核函數(shù)學(xué)習(xí)機(jī),該方法適用于基于核的分類和回歸。 christian kaiser還介紹了一種擴(kuò)展版的區(qū)域到點(diǎn)建模方法,來適應(yīng)來自空間區(qū)域的大量數(shù)據(jù)。yael ben-haim 研究了三種 mapreduce實(shí)現(xiàn)架構(gòu)下并行決策樹分類算法的設(shè)計(jì) ,并在phoenix共享內(nèi)存架構(gòu)上對(duì) sprint 算法進(jìn)行了具體的并行實(shí)現(xiàn)。f. yan考慮了潛在狄利克 雷分配( lda) 的兩種推理方法塌縮吉布斯采樣(collapsed gibbssampling,cgs)和塌縮變分貝葉斯推理( collapsedvariationa

29、l bayesian,cvb)在gpu上的并行化問題。為解決 gpu上的有限內(nèi)存限制問題,f. yan 提出一種能有效降低內(nèi)存開銷的新穎數(shù)據(jù)劃分方案。這種 劃分方案也能平衡多重處理器的計(jì)算開銷,并能容易地避 免內(nèi)存訪問沖突。他們使用數(shù)據(jù)流來處理超大的數(shù)據(jù)集。 大量實(shí)驗(yàn)表明 f. yan的并行推理方法得到的 lda 模型一貫地具有與串行推理方法相同的預(yù)測(cè)能力;但在一個(gè)有30 個(gè)多核處理器的 gpu上, cgs方法得到了 26倍的加速, cvb 方法得到了 196倍的加速。他們提出的劃分方案和數(shù) 據(jù)流方式使他們的方法在有更多多重處理器時(shí)可伸縮,而 且可被作為通用技術(shù)來并行其它數(shù)據(jù)挖掘模型。bao-

30、liang lu提出了一種并行的支持向量機(jī),稱為最小最大模塊化網(wǎng)絡(luò) (m3) ,它是基“分而治之”的思想解決大規(guī)模問題的有效的學(xué)習(xí)算法。針對(duì)異構(gòu)云中進(jìn)行大數(shù)據(jù)分析服.精品資料務(wù)的并行化問題 g.jung提出了最大覆蓋裝箱算法來決定系統(tǒng)中多少節(jié)點(diǎn)、哪些節(jié)點(diǎn)應(yīng)該應(yīng)用于大數(shù)據(jù)分析的并行執(zhí)行。這種方法可以使大數(shù)據(jù)進(jìn)行分配使得各個(gè)計(jì)算節(jié)點(diǎn)可以同步的結(jié)束計(jì)算,并且使數(shù)據(jù)塊的傳輸可以和上一個(gè)塊的計(jì)算進(jìn)行重疊來節(jié)省時(shí)間。實(shí)驗(yàn)表明,這種方法比其他的方法可以提高大約 60% 的性能。在分布式系統(tǒng)方面, cheng 等人 提出一個(gè)面向大規(guī)??缮炜s數(shù)據(jù)分析的可伸縮的分布式系統(tǒng) glad。e glade通過用戶自定義聚

31、合(uda)接口并且在輸入數(shù)據(jù)上有效地運(yùn)行來進(jìn)行數(shù)據(jù)分析。文章從兩個(gè)方面來論證了系統(tǒng)的有效性。第一,文章展示了如何使用一系列分析功能來完成數(shù)據(jù)處理。第二, 文章將glade與兩種不同類型的系統(tǒng)進(jìn)行比較:一個(gè)用uda進(jìn)行改良的關(guān)系型數(shù)據(jù)庫(postgresql)和mapreduce(hadoop。)然后從運(yùn)行結(jié)果、伸縮性以及運(yùn)行時(shí)間上對(duì)不同類型的系統(tǒng)進(jìn)行了比較。四、總結(jié)大數(shù)據(jù)的超大容量自然需要容量大,速度快,安全的存儲(chǔ),滿足這種要求的存儲(chǔ)離不開云計(jì)算。高速產(chǎn)生的大數(shù)據(jù)只有通過云計(jì)算的方式才能在可等待的時(shí)間內(nèi)對(duì)其進(jìn)行處理。同時(shí),云計(jì)算是提高對(duì)大數(shù)據(jù)的分析與理解能力的一個(gè)可行方案。大數(shù)據(jù)的價(jià)值也只有

32、通.精品資料過數(shù)據(jù)挖掘才能從低價(jià)值密度的數(shù)據(jù)中發(fā)現(xiàn)其潛在價(jià)值, 而大數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)離不開云計(jì)算技術(shù)??傊?,云計(jì)算是大數(shù)據(jù)處理的核心支撐技術(shù),是大數(shù)據(jù)挖掘的主流方式。沒有互聯(lián)網(wǎng),就沒有虛擬化技術(shù)為核心的云計(jì)算技 術(shù),沒有云計(jì)算就沒有大數(shù)據(jù)處理的支撐技術(shù)。參考文獻(xiàn)秦榮生.大數(shù)據(jù)、云計(jì)算技術(shù)對(duì)審計(jì)的影響研究何清.大數(shù)據(jù)與云計(jì)算張為民.云計(jì)算:深刻改變未來文峰.云計(jì)算與云審計(jì)關(guān)于未來審計(jì)的概念與框架的一些思考big data and cloud computingbig data (big data) in recent years, more and more occasions, the concept is mentioned more and more people, and often, and cloud computing together, what is the relationship between cloud computing and big data become a hot topic. this specialreport contains the following four aspects: 1. thevalue of big data; 2. big data challenge; 3.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論