




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)時(shí)代
大數(shù)據(jù)時(shí)代
1大數(shù)據(jù)培訓(xùn)知識(shí)(-)課件2大數(shù)據(jù)培訓(xùn)知識(shí)(-)課件3目錄大數(shù)據(jù)的背景大數(shù)據(jù)的定義大數(shù)據(jù)的分類大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)給我們帶來(lái)了什么大數(shù)據(jù)面臨的挑戰(zhàn)和趨勢(shì)大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)目錄大數(shù)據(jù)的背景4一、大數(shù)據(jù)時(shí)代的背景21世紀(jì)是數(shù)據(jù)信息大發(fā)展的時(shí)代,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大?;ヂ?lián)網(wǎng)(社交、搜索、電商)、移動(dòng)互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融(銀行、股市、保險(xiǎn))、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。“大數(shù)據(jù)”的誕生:半個(gè)世紀(jì)以來(lái),隨著計(jì)算機(jī)技術(shù)全面融入社會(huì)生活,信息爆炸已經(jīng)積累到了一個(gè)開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長(zhǎng)速度也在加快。信息爆炸式的增長(zhǎng),創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念*。如今,這個(gè)概念幾乎應(yīng)用到了所有人類智力與發(fā)展的領(lǐng)域中。一、大數(shù)據(jù)時(shí)代的背景21世紀(jì)是數(shù)據(jù)信息大發(fā)5全球每秒鐘發(fā)送2.9百萬(wàn)封電子郵件,一分鐘讀一篇的話,足夠一個(gè)人晝夜不息的讀5.5年…每天會(huì)有
2.88萬(wàn)個(gè)小時(shí)的視頻上傳到Y(jié)outube,足夠一個(gè)人晝夜不息的觀看3.3年…推特上每天發(fā)布5千萬(wàn)條消息,假設(shè)10秒鐘瀏覽一條信息,這些消息足夠一個(gè)人晝夜不息的瀏覽16年…每天亞馬遜上將產(chǎn)生6.3百萬(wàn)筆訂單…每個(gè)月網(wǎng)民在Facebook上要花費(fèi)7千億分鐘,被移動(dòng)互聯(lián)網(wǎng)使用者發(fā)送和接收的數(shù)據(jù)高達(dá)1.3EB…Google上每天需要處理24PB的數(shù)據(jù)…新的時(shí)代,人們從信息的被動(dòng)接受者變成了主動(dòng)創(chuàng)造者大數(shù)據(jù)時(shí)代到來(lái)全球每秒鐘發(fā)送2.9百萬(wàn)封電子郵件,一分鐘讀一篇的話,足6TBPBZBEB大量新數(shù)據(jù)源的出現(xiàn)則導(dǎo)致了非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式的增長(zhǎng)根據(jù)監(jiān)測(cè),人類產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級(jí)增長(zhǎng),大約每?jī)赡攴环@個(gè)速度在2020年之前會(huì)繼續(xù)保持下去。這意味著人類在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量數(shù)據(jù)量增加數(shù)據(jù)結(jié)構(gòu)日趨復(fù)雜這些由我們創(chuàng)造的信息背后產(chǎn)生的這些數(shù)據(jù)早已經(jīng)遠(yuǎn)遠(yuǎn)超越了目前人力所能處理的范疇大數(shù)據(jù)時(shí)代正在來(lái)臨..大數(shù)據(jù)時(shí)代到來(lái)TBPBZBEB大量新數(shù)據(jù)源的出現(xiàn)則導(dǎo)致了非結(jié)構(gòu)化、半結(jié)構(gòu)化7二、大數(shù)據(jù)的定義
在2012年的IT業(yè)界中,“大數(shù)據(jù)”(BigData)成了關(guān)注度不斷提高的關(guān)鍵詞之一?!按髷?shù)據(jù)”是一個(gè)起源于歐美的詞匯。不過(guò),關(guān)于這個(gè)詞的起源時(shí)間并不是十分清楚。至今為止,最具影響力的說(shuō)法是2010年2月出版的?經(jīng)濟(jì)學(xué)家?(TheEconomist)雜志中的一篇題為“Thedatadeluge”的文章。其中,“deluge”的解釋是"數(shù)據(jù)洪流或海量數(shù)據(jù)"。那么,究竟何為大數(shù)據(jù)?一般來(lái)說(shuō),可以從狹義和廣義兩個(gè)層面來(lái)進(jìn)行理解。二、大數(shù)據(jù)的定義8狹義的大數(shù)據(jù)
狹義的大數(shù)據(jù)就是指用現(xiàn)在的一般技術(shù)難以管理的大量數(shù)據(jù)的集合。大數(shù)據(jù)不僅僅是容量大而已,可以用3v來(lái)描述大數(shù)據(jù)的特征:Volume(容量)、Variety(多樣性)、Velocity(速度)。1.容量也就是指數(shù)據(jù)量,基本上是指從幾十TB到幾PB這樣的數(shù)量級(jí);甚至可能發(fā)展到EB數(shù)量級(jí)。(1TB=1024GB,1PB=1024TB,1EB=1024PB)2.多樣性網(wǎng)站日志數(shù)據(jù)、Facebook等媒體中的文本數(shù)據(jù),智能手機(jī)中內(nèi)置的GPS所產(chǎn)生的位置信息,監(jiān)控?cái)z像機(jī)的視頻數(shù)據(jù)等。3.速度也就是數(shù)據(jù)產(chǎn)生和更新的頻率。狹義的大數(shù)據(jù)狹義的大數(shù)據(jù)就是指用現(xiàn)在的一般技術(shù)難以9廣義的大數(shù)據(jù)廣義的大數(shù)據(jù)是一個(gè)綜合性的概念,它包括因具備3v特征而難以進(jìn)行管理的數(shù)據(jù)對(duì)這些數(shù)據(jù)進(jìn)行存儲(chǔ)、處理、分析的技術(shù)能夠通過(guò)分析這些數(shù)據(jù)獲得實(shí)用意義和觀點(diǎn)的人才和組織這些人才和組織指的是目前在歐美十分緊俏的“數(shù)據(jù)科學(xué)家”這類人才,以及能夠?qū)Υ髷?shù)據(jù)進(jìn)行有效運(yùn)用的組織。由此廣義的概念可知,除了自身的特征外,人才的作用在大數(shù)據(jù)時(shí)代中日益突出。廣義的大數(shù)據(jù)廣義的大數(shù)據(jù)是一個(gè)綜合性的概念,它包括10三、大數(shù)據(jù)的分類按生產(chǎn)主體劃分按數(shù)據(jù)來(lái)源劃分按存儲(chǔ)形式劃分三、大數(shù)據(jù)的分類按生產(chǎn)主體劃分11少量企業(yè)應(yīng)用產(chǎn)生的數(shù)據(jù)關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)微博、微信電子商務(wù)在線交易日志數(shù)據(jù)評(píng)論、留言或者電話投訴等企業(yè)應(yīng)用的相關(guān)評(píng)論數(shù)據(jù)應(yīng)用服務(wù)器日志傳感器數(shù)據(jù)(天氣、水、智能電網(wǎng)等)圖像和視頻(攝像頭監(jiān)控?cái)?shù)據(jù)等)RFID、二維碼或條形碼掃描數(shù)據(jù)大量人產(chǎn)生的數(shù)據(jù)巨量機(jī)器產(chǎn)生的數(shù)據(jù)大數(shù)據(jù)的分類—按生產(chǎn)主體劃分少量企業(yè)應(yīng)用產(chǎn)生的數(shù)據(jù)關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)微博、微信應(yīng)用服務(wù)12
1、BAT為代表的互聯(lián)網(wǎng)公司。2、電信、金融、保險(xiǎn)、電力、石化系統(tǒng)。3、公共安全、醫(yī)療、交通領(lǐng)域。4、氣象、教育、地理、政務(wù)等。5、其他,商業(yè)銷售、制造業(yè)、農(nóng)業(yè)、物流和流通等領(lǐng)域。大數(shù)據(jù)分類—按數(shù)據(jù)來(lái)源劃分大數(shù)據(jù)分類—按數(shù)據(jù)來(lái)源劃分13阿里巴巴目前保存的數(shù)據(jù)量為近百PB擁有90%以上的電商數(shù)據(jù)交易數(shù)據(jù)、用戶瀏覽和點(diǎn)擊網(wǎng)頁(yè)數(shù)據(jù)、購(gòu)物數(shù)據(jù)2013數(shù)據(jù)總量接近一千個(gè)PB中文網(wǎng)頁(yè)、百度推廣、百度日志、UGC以70%以上的搜索市場(chǎng)份額坐擁龐大的搜索數(shù)據(jù)騰訊總存儲(chǔ)數(shù)據(jù)量經(jīng)壓縮處理以后在100PB左右數(shù)據(jù)量月增10%大量社交、游戲等領(lǐng)域積累的文本、音頻、視頻和關(guān)系類數(shù)據(jù)百度大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分BAT為代表的互聯(lián)網(wǎng)公司阿里巴巴目前保存的數(shù)據(jù)量為近百PB2013數(shù)據(jù)總量接近一千個(gè)14電信行業(yè)用戶上網(wǎng)記錄、通話、信息、地理位置運(yùn)營(yíng)商擁有的數(shù)據(jù)數(shù)量都在10PB以上年度用戶數(shù)據(jù)增長(zhǎng)約數(shù)十PB開戶信息數(shù)據(jù),銀行網(wǎng)點(diǎn)和在線交易數(shù)據(jù)、自身運(yùn)營(yíng)的數(shù)據(jù)金融系統(tǒng)每年產(chǎn)生數(shù)據(jù)達(dá)數(shù)十PB保險(xiǎn)系統(tǒng)數(shù)據(jù)量也接近PB級(jí)別電力與石化僅國(guó)家電網(wǎng)采集獲得的數(shù)據(jù)總量就上10個(gè)PB級(jí)別石油化工、智能水表等領(lǐng)域每年產(chǎn)生和保存下來(lái)的數(shù)據(jù)量也達(dá)到數(shù)十PB級(jí)別。金融與保險(xiǎn)大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分電信、金融與保險(xiǎn)、電力、石化系統(tǒng)電信行業(yè)用戶上網(wǎng)記錄、通話、信息、地理位置開戶信息數(shù)據(jù),銀行15公共安全北京:50萬(wàn)個(gè)監(jiān)控?cái)z像頭,每天采集視頻數(shù)據(jù)量約3PB整個(gè)視頻監(jiān)控每年保存下來(lái)的數(shù)據(jù)在數(shù)百PB以上僅廣州中山大學(xué)醫(yī)院2013年數(shù)據(jù)量為1000個(gè)TB整個(gè)醫(yī)療衛(wèi)生行業(yè)一年能夠保存下來(lái)的數(shù)據(jù)就可達(dá)到數(shù)百PB交通航班往返一次能產(chǎn)生數(shù)據(jù)就達(dá)到TB級(jí)別列車、水陸路運(yùn)輸產(chǎn)生的各種視頻、文本類數(shù)據(jù),每年保存下來(lái)的也達(dá)到數(shù)十PB。醫(yī)療衛(wèi)生大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分公共安全、醫(yī)療衛(wèi)生、交通領(lǐng)域公共安全北京:50萬(wàn)個(gè)監(jiān)控?cái)z像頭,每天采集視頻數(shù)據(jù)量約3PB16氣象與地理中國(guó)氣象局保存的數(shù)據(jù)約4~5PB,每年約增數(shù)百個(gè)TB各種地圖和地理位置信息每年約數(shù)十PB北京市政務(wù)數(shù)據(jù)資源網(wǎng)涵蓋旅游、教育、交通、醫(yī)療等門類,一年上線公布了400余個(gè)數(shù)據(jù)包政務(wù)數(shù)據(jù)多為結(jié)構(gòu)化數(shù)據(jù)政務(wù)與教育大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分氣象、地里、教育、政務(wù)等領(lǐng)域氣象與地理中國(guó)氣象局保存的數(shù)據(jù)約4~5PB,每年約增數(shù)百個(gè)T17大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分其他傳統(tǒng)行業(yè)線下商業(yè)銷售、農(nóng)林牧漁業(yè)、線下餐飲、食品、科研、物流運(yùn)輸?shù)刃袠I(yè)數(shù)據(jù)量劇增行業(yè)數(shù)據(jù)量還處于積累期,整個(gè)體量都不算大,多則達(dá)到PB級(jí)別,少則百TB甚至數(shù)十TB級(jí)別。制造業(yè)制造業(yè)的存儲(chǔ)數(shù)據(jù)類型:產(chǎn)品設(shè)計(jì)數(shù)據(jù):以文件為主,非結(jié)構(gòu)化,共享要求較高,保存時(shí)間較長(zhǎng)。企業(yè)生產(chǎn)環(huán)節(jié)的業(yè)務(wù)數(shù)據(jù):數(shù)據(jù)庫(kù)結(jié)構(gòu)化數(shù)據(jù)生產(chǎn)監(jiān)控?cái)?shù)據(jù):數(shù)據(jù)量非常大商業(yè)銷售、制造業(yè)、農(nóng)業(yè)、物流和流通等領(lǐng)域大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分其他傳統(tǒng)行業(yè)線下商業(yè)銷售、農(nóng)林牧18大數(shù)據(jù)分類—按存儲(chǔ)形式劃分
大數(shù)據(jù)不僅僅體現(xiàn)數(shù)據(jù)量大,也體現(xiàn)在數(shù)據(jù)類型多。如此海量的數(shù)據(jù)中,僅有20%左右屬于結(jié)構(gòu)化數(shù)據(jù),80%的數(shù)據(jù)屬于廣泛存在于社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、電子商務(wù)等領(lǐng)域的非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)分類—按存儲(chǔ)形式劃分大數(shù)據(jù)不僅僅體現(xiàn)數(shù)據(jù)量19大數(shù)據(jù)分類——按存儲(chǔ)形式劃分即行數(shù)據(jù),可用二維表結(jié)構(gòu)來(lái)邏輯表達(dá)實(shí)現(xiàn)主要存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中先有結(jié)構(gòu)再有數(shù)據(jù),結(jié)構(gòu)一般不變處理起來(lái)較方便結(jié)構(gòu)化數(shù)據(jù)大數(shù)據(jù)分類——按存儲(chǔ)形式劃分即行數(shù)據(jù),可用二維表結(jié)構(gòu)來(lái)邏輯表20大數(shù)據(jù)分類——按存儲(chǔ)形式劃分相對(duì)于結(jié)構(gòu)化數(shù)據(jù)而言,不方便用數(shù)據(jù)庫(kù)二維邏輯表來(lái)表現(xiàn)非純文本類數(shù)據(jù),沒有標(biāo)準(zhǔn)格式包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息存儲(chǔ)在非結(jié)構(gòu)數(shù)據(jù)庫(kù)中非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù):突破了關(guān)系數(shù)據(jù)庫(kù)結(jié)構(gòu)定義不易改變和數(shù)據(jù)定長(zhǎng)的限制非結(jié)構(gòu)化數(shù)據(jù)大數(shù)據(jù)分類——按存儲(chǔ)形式劃分相對(duì)于結(jié)構(gòu)化數(shù)據(jù)而言,不方便用數(shù)21大數(shù)據(jù)分類——按存儲(chǔ)形式劃分介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的數(shù)據(jù)之間格式較為規(guī)范,一般都是純文本數(shù)據(jù)包括日志數(shù)據(jù)、XML、JSON等格式的數(shù)據(jù)一般是自描述的,數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容混在一起,沒有明顯的區(qū)分?jǐn)?shù)據(jù)模型主要為樹和圖的形式。半結(jié)構(gòu)化數(shù)據(jù)大數(shù)據(jù)分類——按存儲(chǔ)形式劃分介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的22四、大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用大數(shù)據(jù)在金融業(yè)的應(yīng)用大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用大數(shù)據(jù)在社會(huì)管理中的應(yīng)用四、大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用23大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用IBM日本公司建立了一個(gè)經(jīng)濟(jì)指標(biāo)預(yù)測(cè)系統(tǒng),它從互聯(lián)網(wǎng)新聞中搜索出影響制造業(yè)的480項(xiàng)經(jīng)濟(jì)數(shù)據(jù),再計(jì)算出PMI預(yù)測(cè)值,準(zhǔn)確度相當(dāng)高。印第安納大學(xué)學(xué)者利用Google提供的心情分析工具,根據(jù)用戶近千萬(wàn)條短信、微博留言中預(yù)測(cè)道瓊斯工業(yè)指數(shù)。準(zhǔn)確率高達(dá)87%。淘寶網(wǎng)建立了“淘寶CPI”,它通過(guò)采集、編制淘寶網(wǎng)上390個(gè)類目的熱門商品價(jià)格來(lái)統(tǒng)計(jì)CPI,它比國(guó)家統(tǒng)計(jì)局公布的CPI還提前半個(gè)月預(yù)測(cè)經(jīng)濟(jì)的走勢(shì)。大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用IBM日本公司建立了一個(gè)經(jīng)濟(jì)指24大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用Google前雇員創(chuàng)辦Climate公司,從美國(guó)氣象局等數(shù)據(jù)庫(kù)中獲得幾十年的天氣數(shù)據(jù),將各地的降雨、氣溫和土壤狀況及歷年農(nóng)作物產(chǎn)量做成精密圖表,從而能夠預(yù)測(cè)美國(guó)任一農(nóng)場(chǎng)下一年的產(chǎn)量。任何一個(gè)農(nóng)場(chǎng)主去他那里問(wèn)明年種什么能賣出去、能賺錢,他能告訴你,說(shuō)錯(cuò)了他保證賠償,賠償比保險(xiǎn)公司還要高,到現(xiàn)在為止他還沒有賠過(guò)。通過(guò)手機(jī)上農(nóng)產(chǎn)品“移動(dòng)支付”數(shù)據(jù)、“采購(gòu)?fù)度搿睌?shù)據(jù)和“補(bǔ)貼“數(shù)據(jù)分析,可準(zhǔn)確預(yù)測(cè)農(nóng)產(chǎn)品生產(chǎn)趨勢(shì),政府可依此決定出臺(tái)激勵(lì)措施和確定合適的作物存儲(chǔ)量,還可為農(nóng)民提供服務(wù)。大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用Google前雇員創(chuàng)辦Climate公25大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用沃爾瑪基于每個(gè)月4500萬(wàn)的網(wǎng)絡(luò)購(gòu)物數(shù)據(jù),并結(jié)合社交網(wǎng)絡(luò)上有關(guān)產(chǎn)品的大眾評(píng)分,開發(fā)機(jī)器學(xué)習(xí)語(yǔ)義搜索引擎“北極星“,方便瀏覽,在線購(gòu)物者因此增加10%-15%,增加銷售十多億美元。當(dāng)顧客在超市買東西時(shí),通過(guò)手機(jī)定位,可以分析他們?cè)谪浌袂巴A魰r(shí)間的長(zhǎng)短,從而判斷顧客對(duì)什么感興趣。不僅僅是通過(guò)手機(jī)定位,實(shí)際上美國(guó)有的超市在購(gòu)物推車上也安裝了位置傳感器,根據(jù)顧客在不同貨物前停留時(shí)間的長(zhǎng)短來(lái)分析顧客可能的購(gòu)物行為。在淘寶網(wǎng)上買東西時(shí),消費(fèi)者會(huì)在阿里的廣告交易平臺(tái)上留下記錄,阿里不僅從交易平臺(tái)把消費(fèi)記錄拿來(lái)自己使用,還會(huì)把消費(fèi)記錄賣給其他商家。大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用沃爾瑪基于每個(gè)月4500萬(wàn)的網(wǎng)絡(luò)購(gòu)物數(shù)26大數(shù)據(jù)在金融業(yè)的應(yīng)用華爾街某公司通過(guò)分析全球3.4億微博賬戶留言來(lái)判斷民眾情緒,人們高興的時(shí)候會(huì)買股票,而焦慮的時(shí)候會(huì)拋售股票,它通過(guò)判斷全世界高興的人多還是焦慮的人多,依此決定公司股票的買入或賣出。阿里公司根據(jù)在淘寶網(wǎng)上中小企業(yè)的交易狀況篩選出財(cái)務(wù)健康和誠(chéng)信經(jīng)營(yíng)的企業(yè),給他們提供貸款,并且不需要這些中小企業(yè)的擔(dān)保。目前阿里公司已放貸上千億元,壞帳率僅0.3%。2012年年底,四大商業(yè)銀行的壞賬率為1%左右,盡管四大銀行要求有擔(dān)保,但壞賬率仍然比阿里高出3倍。大數(shù)據(jù)在金融業(yè)的應(yīng)用華爾街某公司通過(guò)分析全球3.4億微博賬戶27大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用Google通過(guò)用戶搜索與流感相關(guān)詞匯的頻率,判斷某個(gè)地方可能會(huì)發(fā)生流感。2009年在甲型H1N1流感爆發(fā)的幾周前,Google就做出預(yù)測(cè),而且還判斷出了流感是從哪里來(lái)的。大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用Google通過(guò)用戶搜索與流感相關(guān)28大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用根據(jù)麥肯錫的報(bào)告,醫(yī)療大數(shù)據(jù)的分析將為美國(guó)產(chǎn)生3000億美元的價(jià)值,減少8%的國(guó)家醫(yī)療保健支出。大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用根據(jù)麥肯錫的報(bào)告,醫(yī)療大數(shù)據(jù)的分析29大數(shù)據(jù)在社會(huì)管理中的應(yīng)用廣東東莞通過(guò)統(tǒng)計(jì)當(dāng)?shù)厥雏}銷售量與上年同期比較,判斷農(nóng)民工數(shù)量的變化。這與電信運(yùn)營(yíng)商根據(jù)活躍移動(dòng)用戶數(shù)的變化所推出的數(shù)據(jù)幾乎相當(dāng)。根據(jù)手機(jī)用戶從這個(gè)路口到那個(gè)路口所花費(fèi)的時(shí)間,可以判斷馬路上是不是流量比較多,是否擁堵。根據(jù)有多少個(gè)手機(jī)在同時(shí)移動(dòng),大致可以了解發(fā)生突發(fā)事件時(shí)的人流聚集情況,還可以通過(guò)手機(jī)的注冊(cè)地進(jìn)一步分析機(jī)主究竟是從哪里來(lái)的。騰訊為每個(gè)微博用戶建立了檔案,可以從微博帖子分析用戶的性格,提前關(guān)注可能引起社會(huì)不穩(wěn)定的因素。大數(shù)據(jù)在社會(huì)管理中的應(yīng)用廣東東莞通過(guò)統(tǒng)計(jì)當(dāng)?shù)厥雏}銷售量與上年30五、大數(shù)據(jù)帶來(lái)了什么?大數(shù)據(jù)既催生出無(wú)數(shù)新的服務(wù)和商業(yè)模式,也讓一些傳統(tǒng)行業(yè)找到了新的機(jī)會(huì),同時(shí)產(chǎn)生了對(duì)“數(shù)據(jù)科學(xué)家”這種新興復(fù)合型人才的迫切需求。但是,數(shù)據(jù)運(yùn)用和隱私保護(hù)之間到底應(yīng)該如何權(quán)衡,也成了一個(gè)令各方勢(shì)力爭(zhēng)論不休的話題。所以,對(duì)于大數(shù)據(jù)帶來(lái)的影響,必須從積極影響和消極影響兩個(gè)層面來(lái)分析。五、大數(shù)據(jù)帶來(lái)了什么?大數(shù)據(jù)既催生出無(wú)數(shù)新的服務(wù)和31積極影響
首先,大數(shù)據(jù)有利于推動(dòng)中國(guó)新四化轉(zhuǎn)型。新四化是指新型工業(yè)化、信息化、城鎮(zhèn)化和農(nóng)業(yè)現(xiàn)代化。大數(shù)據(jù)將會(huì)改變?nèi)祟惿钌a(chǎn)方式,可以為新四化提供轉(zhuǎn)變發(fā)展方式的新動(dòng)力。1.大數(shù)據(jù)可以強(qiáng)力啟動(dòng)內(nèi)需;2.大數(shù)據(jù)可以推動(dòng)城鎮(zhèn)化以智慧城市的新方式發(fā)展;3.大數(shù)據(jù)有利于改進(jìn)政府管理方式;4.大數(shù)據(jù)產(chǎn)業(yè)將會(huì)形成新的增長(zhǎng)點(diǎn)。
積極影響首先,大數(shù)據(jù)有利于推動(dòng)中國(guó)新四化轉(zhuǎn)型。32
其次,大數(shù)據(jù)將對(duì)微觀經(jīng)濟(jì)產(chǎn)生重大影響。
IBM的CEO羅睿蘭說(shuō):“數(shù)據(jù)將是下一個(gè)大的自然資源,將會(huì)區(qū)分每個(gè)行業(yè)的勝者與輸家。”IBM的全球調(diào)查顯示:表現(xiàn)優(yōu)秀的企業(yè)使用分析技術(shù)的數(shù)量比表現(xiàn)較差的企業(yè)高五倍。1.未來(lái)以政府、電信、教育、醫(yī)療、金融、石油石化和電力等行業(yè)為重點(diǎn)的大數(shù)據(jù)應(yīng)用,將直接拉動(dòng)整個(gè)社會(huì)的應(yīng)用規(guī)模;2.數(shù)據(jù)業(yè)務(wù)將成為各行各業(yè)的主營(yíng)業(yè)務(wù),圍繞大數(shù)據(jù),企業(yè)將向分析級(jí)服務(wù)升級(jí)轉(zhuǎn)型,從而改變各行各業(yè)的業(yè)態(tài);3.廣義的分析級(jí)服務(wù)得到大發(fā)展,包含一切以大數(shù)據(jù)為基礎(chǔ)的高附加值的創(chuàng)新型服務(wù)。其次,大數(shù)據(jù)將對(duì)微觀經(jīng)濟(jì)產(chǎn)生重大影響。33
再次,大數(shù)據(jù)的發(fā)展有利于促進(jìn)新興職業(yè)的發(fā)展。
在大數(shù)據(jù)浪潮的沖擊下,一門新興職業(yè)即“數(shù)據(jù)分析師”(數(shù)據(jù)科學(xué)家)正在以勢(shì)不可擋的氣勢(shì)涌現(xiàn)。大數(shù)據(jù)使勞動(dòng)力市場(chǎng)迅速出現(xiàn)了變化,數(shù)據(jù)分析師成為炙手可熱的行業(yè)。麥肯錫全球研究所進(jìn)行過(guò)一次調(diào)查,根據(jù)調(diào)查預(yù)計(jì),美國(guó)需要14萬(wàn)名至19萬(wàn)名以上具備深度分析專長(zhǎng)的人員。而對(duì)具備數(shù)據(jù)知識(shí)的經(jīng)理的需求量超過(guò)150萬(wàn)名。一個(gè)在業(yè)界不可言喻的現(xiàn)象出現(xiàn)了,數(shù)據(jù)分析師已經(jīng)能夠成為最為搶手的熱門職業(yè)。
再次,大數(shù)據(jù)的發(fā)展有利于促進(jìn)新興職業(yè)的發(fā)展。34消極影響
關(guān)于大數(shù)據(jù)所帶來(lái)的消極影響主要表現(xiàn)為大數(shù)據(jù)運(yùn)用和隱私保護(hù)之間的矛盾。要在業(yè)務(wù)中對(duì)大數(shù)據(jù)進(jìn)行運(yùn)用,就不可避免的會(huì)遇到隱私問(wèn)題。
首先,對(duì)web上的用戶個(gè)人信息、行為記錄等進(jìn)行收集,在未經(jīng)用戶許可的情況下將數(shù)據(jù)轉(zhuǎn)讓給廣告商等第三方,這種行為嚴(yán)重侵犯了用戶的個(gè)人隱私權(quán),而且會(huì)對(duì)其造成一定程度的危害;其次,網(wǎng)頁(yè)上的行為記錄,如瀏覽記錄和購(gòu)買記錄等,如果進(jìn)行了相當(dāng)數(shù)量的積累,則有可能據(jù)此推斷出個(gè)人的興趣、愛好、思想傾向等。而對(duì)于用戶來(lái)說(shuō),他們很不希望這些信息被別人知道,所以在心理上會(huì)感覺到自己的隱私受到了侵犯。消極影響關(guān)于大數(shù)據(jù)所帶來(lái)的消極影響主要表現(xiàn)為35
在今天,關(guān)于隱私是一個(gè)很大的問(wèn)題,而且以后這個(gè)問(wèn)題還會(huì)越來(lái)越嚴(yán)重,會(huì)被人們高度關(guān)注。所以,對(duì)于企業(yè)來(lái)說(shuō),不僅要遵守正式法律的限制,而且不能逾越顧客所能接受的最低底線。必須時(shí)刻把用戶的地位放在首位,盡可能的多為顧客提供便利,盡最大努力贏得用戶的理解和支持。在今天,關(guān)于隱私是一個(gè)很大的問(wèn)題,而且以后這個(gè)36六、大數(shù)據(jù)面臨的挑戰(zhàn)和趨勢(shì)
從大數(shù)據(jù)帶來(lái)的影響可知,大數(shù)據(jù)浪潮既是一種機(jī)遇也是一種挑戰(zhàn),必須權(quán)衡利弊。
趨勢(shì)隨著大數(shù)據(jù)浪潮的加速到來(lái),將出現(xiàn)產(chǎn)業(yè)鏈的整體繁榮。如何在大數(shù)據(jù)浪潮的洗禮中確保技術(shù)架構(gòu)、人才、政府和企業(yè)戰(zhàn)略以及商業(yè)模式能夠“逐浪潮頭”,將更需要積極主動(dòng)的選擇合適的技術(shù)、方法論、解決方案和發(fā)展策略等。六、大數(shù)據(jù)面臨的挑戰(zhàn)和趨勢(shì)從大數(shù)據(jù)帶來(lái)的影響可37
環(huán)顧整個(gè)市場(chǎng),我們?cè)谀承╊I(lǐng)域已經(jīng)取得了突破性進(jìn)展,但是,仍然面臨著大量挑戰(zhàn)。例如:研發(fā)分析各種多元結(jié)構(gòu)化數(shù)據(jù)的高效技術(shù),提高大數(shù)據(jù)分析的易用性,讓大數(shù)據(jù)分析技術(shù)實(shí)現(xiàn)“開箱即用”,使得數(shù)據(jù)分析成為政府和企業(yè)建立核心競(jìng)爭(zhēng)力的關(guān)鍵途徑。另外,具備高端數(shù)據(jù)分析技能,能夠從堆積如山的大量數(shù)據(jù)中找到金礦,并能夠?qū)?shù)據(jù)的價(jià)值以易懂的方式傳達(dá)給決策者,最終得以在業(yè)務(wù)上實(shí)現(xiàn)的人才即數(shù)據(jù)科學(xué)家是千金難求的。挑戰(zhàn)挑戰(zhàn)38七、大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)大數(shù)據(jù)時(shí)代就不需要統(tǒng)計(jì)了嗎?有人認(rèn)為大數(shù)據(jù)時(shí)代,數(shù)據(jù)的來(lái)源更加直接、多元,并且數(shù)據(jù)的“樣本=總體”,想要的結(jié)論直接就能看出來(lái),已經(jīng)不需要統(tǒng)計(jì)了。
這種認(rèn)知,顯然是錯(cuò)誤的七、大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)大數(shù)據(jù)時(shí)代就不需要統(tǒng)計(jì)了嗎?39首先,并不是所有的數(shù)據(jù)都可以直接在網(wǎng)絡(luò)上得到的,很多數(shù)據(jù)需要統(tǒng)計(jì)部門組織專業(yè)的調(diào)查才能得到,比如,農(nóng)業(yè)生產(chǎn)方面的數(shù)據(jù)、人口分布等等。其次,大數(shù)據(jù)告知信息,但不解釋數(shù)據(jù),即使把大數(shù)據(jù)的信息公布出來(lái),大部分民眾依然不知道數(shù)據(jù)要表達(dá)的信息。統(tǒng)計(jì)依然是數(shù)據(jù)分析的靈魂。首先,并不是所有的數(shù)據(jù)都可以直接在網(wǎng)絡(luò)上得到的,很多40大數(shù)據(jù)時(shí)代的到來(lái),給統(tǒng)計(jì)帶來(lái)機(jī)遇,也帶來(lái)了挑戰(zhàn)。2014年1月,國(guó)家統(tǒng)計(jì)局網(wǎng)上轉(zhuǎn)載了“中國(guó)統(tǒng)計(jì),‘向大數(shù)據(jù)時(shí)代’邁進(jìn)!”(
/tjgz/tjdt/201401/t20140108_497003.html)那么,大數(shù)據(jù)時(shí)代到底給統(tǒng)計(jì)帶來(lái)了那些沖擊和挑戰(zhàn)?大數(shù)據(jù)時(shí)代的到來(lái),給統(tǒng)計(jì)帶來(lái)機(jī)遇,也帶來(lái)了挑戰(zhàn)。411.大數(shù)據(jù)對(duì)統(tǒng)計(jì)的沖擊對(duì)統(tǒng)計(jì)理念的沖擊對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊對(duì)政府統(tǒng)計(jì)職能的沖擊1.大數(shù)據(jù)對(duì)統(tǒng)計(jì)的沖擊對(duì)統(tǒng)計(jì)理念的沖擊42對(duì)統(tǒng)計(jì)理念的沖擊1.大數(shù)據(jù)改變了數(shù)據(jù)的需求層次過(guò)去,由于人類的認(rèn)知能力有限,獲取大范圍數(shù)據(jù)比較困難,傳統(tǒng)的統(tǒng)計(jì)是通過(guò)觀察一小部分樣本來(lái)推測(cè)總體,但是推測(cè)的數(shù)據(jù)反映的是總體趨勢(shì),往往無(wú)法應(yīng)用到個(gè)體。大數(shù)據(jù)時(shí)代的來(lái)臨,使人類可以有機(jī)會(huì)和條件在非常多的領(lǐng)域和非常深入的層次獲得全面數(shù)據(jù),在此基礎(chǔ)上形成的的數(shù)據(jù)可以更加偏向個(gè)體情況,更加符合個(gè)體的感知,滿足個(gè)性化需求。對(duì)統(tǒng)計(jì)理念的沖擊1.大數(shù)據(jù)改變了數(shù)據(jù)的需求層次43對(duì)統(tǒng)計(jì)理念的沖擊2.大數(shù)據(jù)改變了統(tǒng)計(jì)實(shí)證的研究范式傳統(tǒng)的統(tǒng)計(jì)遵循自上而下的實(shí)證研究范式,即先從經(jīng)濟(jì)理論或社會(huì)經(jīng)驗(yàn)出發(fā),根據(jù)理論設(shè)定指標(biāo),再去利用統(tǒng)計(jì)數(shù)據(jù)進(jìn)行實(shí)證分析。然而大數(shù)據(jù)采用的是自下而上的數(shù)據(jù)挖掘范式,以數(shù)據(jù)為先導(dǎo)從大量的實(shí)際數(shù)據(jù)中挖掘數(shù)據(jù)之間的關(guān)系并建立模型,乃至形成理論和新的認(rèn)知。這種研究范式是對(duì)傳統(tǒng)統(tǒng)計(jì)研究范式的一種顛覆。對(duì)統(tǒng)計(jì)理念的沖擊2.大數(shù)據(jù)改變了統(tǒng)計(jì)實(shí)證的研究范式44對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊制度設(shè)計(jì)的多樣化傳統(tǒng)的統(tǒng)計(jì)設(shè)計(jì)是根據(jù)統(tǒng)計(jì)研究的目的和研究對(duì)象的特點(diǎn),設(shè)定統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)報(bào)表以及調(diào)查、匯總方法等制度,通過(guò)調(diào)查、訪問(wèn)將生產(chǎn)行為轉(zhuǎn)化為可量化的數(shù)據(jù)。
大數(shù)據(jù)下的制度,面對(duì)的是已存在的或者通過(guò)一定手段可以獲取的大量數(shù)據(jù),需要解決的問(wèn)題是怎么用這些數(shù)據(jù)。對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊制度設(shè)計(jì)的多樣化45對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)采集智能化傳統(tǒng)的統(tǒng)計(jì)是通過(guò)結(jié)構(gòu)化的報(bào)表和統(tǒng)一的計(jì)量方式將調(diào)查對(duì)象的行為轉(zhuǎn)化為可用的數(shù)據(jù),需要被調(diào)查者的參與,一旦調(diào)查對(duì)象不配合,或者采用虛報(bào)、瞞報(bào)、亂報(bào)的方式消極配合,統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量難以控制,并且矯正這些調(diào)查誤差的成本很高。
大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)講大大提高數(shù)據(jù)采集的智能化水平,數(shù)據(jù)來(lái)源于信息技術(shù)記錄下的原始數(shù)據(jù),想要篡改這些數(shù)據(jù)非常困難,數(shù)據(jù)的質(zhì)量將會(huì)大大提高。對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)采集智能化46對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)分析專業(yè)化傳統(tǒng)的統(tǒng)計(jì)分析是根據(jù)統(tǒng)計(jì)制度設(shè)計(jì)的要求以及研究對(duì)象的認(rèn)知,對(duì)采集上來(lái)的結(jié)構(gòu)化統(tǒng)計(jì)數(shù)據(jù)進(jìn)行計(jì)算分析,重點(diǎn)描述過(guò)去的這段時(shí)間發(fā)生的變化,對(duì)未來(lái)的發(fā)展情況進(jìn)行統(tǒng)計(jì)意義上的預(yù)測(cè)。大數(shù)據(jù)背景下的數(shù)據(jù)分析,面對(duì)的大量的已存在于計(jì)算機(jī)、網(wǎng)絡(luò)中的海量數(shù)據(jù),所要做的是分析挖掘數(shù)據(jù)之間的內(nèi)在關(guān)系,尋找更多有價(jià)值的信息,在這種背景下,需要專業(yè)化的數(shù)據(jù)挖掘與處理技術(shù)對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)分析專業(yè)化47對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)發(fā)布透明化大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)的大量存儲(chǔ)和共享,統(tǒng)計(jì)數(shù)據(jù)發(fā)布的公開透明程度將會(huì)極高,沒有公開詳細(xì)、公允計(jì)算方法的數(shù)據(jù)將會(huì)被其他數(shù)據(jù)替代。在發(fā)布結(jié)果上,僅僅告訴個(gè)別人結(jié)果,是遠(yuǎn)遠(yuǎn)不夠的,還需要通過(guò)可視化、交互等方式給予用戶更加方便、高效的使用方式,提供更為詳盡的信息。對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)發(fā)布透明化48對(duì)政府統(tǒng)計(jì)職能的沖擊大數(shù)據(jù)時(shí)代,各種數(shù)據(jù)信息網(wǎng)絡(luò)平臺(tái)全面覆蓋,每個(gè)社會(huì)單位都是數(shù)據(jù)的生產(chǎn)者和提供者,數(shù)據(jù)存儲(chǔ)于信息平臺(tái)的所有者手中,政府統(tǒng)計(jì)機(jī)構(gòu)不再是數(shù)據(jù)的絕對(duì)擁有者,也不再是數(shù)據(jù)的唯一發(fā)布者和解釋人。如果政府統(tǒng)計(jì)機(jī)構(gòu)繼續(xù)在靜態(tài)的框架下封閉運(yùn)行,就無(wú)法反映經(jīng)濟(jì)社會(huì)發(fā)展的變化情況,無(wú)法實(shí)現(xiàn)統(tǒng)計(jì)信息、統(tǒng)計(jì)咨詢和實(shí)行統(tǒng)計(jì)監(jiān)督功能,勢(shì)必被邊緣化對(duì)政府統(tǒng)計(jì)職能的沖擊大數(shù)據(jù)時(shí)代,各種數(shù)據(jù)信息網(wǎng)絡(luò)平臺(tái)492.大數(shù)據(jù)時(shí)代政府統(tǒng)計(jì)的發(fā)展趨勢(shì)大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)應(yīng)該成為社會(huì)經(jīng)濟(jì)發(fā)展的權(quán)威、全面數(shù)據(jù)的主要提供者,是政府掌握的有關(guān)社會(huì)管理和運(yùn)行的行政記錄信息標(biāo)準(zhǔn)規(guī)范制定者和數(shù)據(jù)結(jié)果發(fā)布者。政府統(tǒng)計(jì)應(yīng)整合多方行政記錄信息,結(jié)合自身采集數(shù)據(jù)補(bǔ)充,構(gòu)建權(quán)威的社會(huì)經(jīng)濟(jì)數(shù)據(jù)在線平臺(tái)。作為數(shù)據(jù)整合發(fā)布的維護(hù)部門。
2.大數(shù)據(jù)時(shí)代政府統(tǒng)計(jì)的發(fā)展趨勢(shì)大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)503.借力大數(shù)據(jù)加速政府統(tǒng)計(jì)改改為了轉(zhuǎn)變政府統(tǒng)計(jì)的角色,需要全面改進(jìn)當(dāng)前的政府統(tǒng)計(jì)在獲取、整理和分析客觀事物總體數(shù)量方面的資料的工作過(guò)程,重塑統(tǒng)計(jì)基礎(chǔ)、強(qiáng)化技術(shù)支承、推動(dòng)應(yīng)用社會(huì)化,全面提升統(tǒng)計(jì)能力。多渠道智能獲取數(shù)據(jù)構(gòu)建真正的大數(shù)據(jù)平臺(tái)體現(xiàn)數(shù)據(jù)價(jià)值3.借力大數(shù)據(jù)加速政府統(tǒng)計(jì)改改51多渠道智能獲取數(shù)據(jù)
統(tǒng)計(jì)工作必須適應(yīng)大數(shù)據(jù)時(shí)代的變化和要求,通過(guò)有效利用客觀存在的海量數(shù)據(jù),能夠有效降低統(tǒng)計(jì)調(diào)查的成本,減輕被調(diào)查者的負(fù)擔(dān),緩解被調(diào)查者配合程度降低的矛盾,能夠提高統(tǒng)計(jì)數(shù)據(jù)的即時(shí)性,縮短統(tǒng)計(jì)數(shù)據(jù)生成周期。
大數(shù)據(jù)時(shí)代的自動(dòng)智能數(shù)據(jù)采集蔣時(shí)代數(shù)據(jù)生成主要依賴于及其的客觀測(cè)量,如GPS定位測(cè)量、收銀管理系統(tǒng)、ETC電子收費(fèi)系統(tǒng)等等。當(dāng)前政府統(tǒng)計(jì)法制建設(shè)的全國(guó)聯(lián)網(wǎng)直報(bào)系統(tǒng)很大成都上規(guī)范了統(tǒng)計(jì)人員的工作方式,但是其中人的參與程度仍然很高。大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)采集數(shù)據(jù),一是要壓縮調(diào)查規(guī)模,采集數(shù)據(jù)有針對(duì)性;二是技術(shù)手段要多樣化、智能化,降低人的參與因素和干擾可能;三是應(yīng)用行政記錄與統(tǒng)計(jì)上要有所突破,進(jìn)一步開發(fā)應(yīng)用現(xiàn)有的行政資源。多渠道智能獲取數(shù)據(jù)統(tǒng)計(jì)工作必須適應(yīng)大數(shù)據(jù)時(shí)代的變化和52構(gòu)建真正的大數(shù)據(jù)平臺(tái)
目前我們發(fā)布的數(shù)據(jù)主要是為了滿足黨政領(lǐng)導(dǎo)的需求為主,以社會(huì)需求為輔。這種模式對(duì)統(tǒng)計(jì)而言是有局限性的,容易自我封閉。
大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)應(yīng)建設(shè)容量足夠大的IT基礎(chǔ)設(shè)施,容納所有采集到的數(shù)據(jù)信息,將歷史和現(xiàn)有原始數(shù)據(jù)文件整理歸集到系統(tǒng)中,構(gòu)建成在線公開的官方統(tǒng)計(jì)數(shù)據(jù)平臺(tái)。未來(lái)政府統(tǒng)計(jì)部門將公平公開地開放數(shù)據(jù),所有單位個(gè)人都將能從統(tǒng)計(jì)機(jī)構(gòu)的網(wǎng)站平臺(tái)獲取到需要的、標(biāo)準(zhǔn)統(tǒng)一的、格式開放的數(shù)據(jù)。構(gòu)建真正的大數(shù)據(jù)平臺(tái)目前我們發(fā)布的數(shù)據(jù)主要是為了滿足53體現(xiàn)數(shù)據(jù)的價(jià)值
數(shù)據(jù)只有被人們使用,才會(huì)變成有價(jià)值的信息,統(tǒng)計(jì)成果需要新的返現(xiàn)方式和形式。
除了公布原始基礎(chǔ)數(shù)據(jù),政府統(tǒng)計(jì)數(shù)據(jù)平臺(tái)應(yīng)該具備權(quán)威客觀、公開透明的基本經(jīng)濟(jì)算法、口徑和初步結(jié)果,這些成果應(yīng)該通過(guò)標(biāo)準(zhǔn)的官方經(jīng)濟(jì)核算應(yīng)用以及信息產(chǎn)品的形式對(duì)外提供。
政府統(tǒng)計(jì)應(yīng)該利用專業(yè)的技術(shù)力量和成果,提高數(shù)據(jù)挖掘分析能力,對(duì)巨量原始數(shù)據(jù)進(jìn)行專業(yè)化處理,將非標(biāo)準(zhǔn)化數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)化統(tǒng)計(jì)數(shù)據(jù),從而打好對(duì)數(shù)據(jù)進(jìn)行“增值”的基礎(chǔ)。體現(xiàn)數(shù)據(jù)的價(jià)值數(shù)據(jù)只有被人們使用,才會(huì)變成有價(jià)值的信54謝謝謝謝55
1、用愛心來(lái)做事,用感恩的心做人。
2、人永遠(yuǎn)在追求快樂(lè),永遠(yuǎn)在逃避痛苦。
3、有多大的思想,才有多大的能量。
4、人的能量=思想+行動(dòng)速度的平方。
5、勵(lì)志是給人快樂(lè),激勵(lì)是給人痛苦。
6、成功者絕不給自己軟弱的借口。
7、你只有一定要,才一定會(huì)得到。
8、決心是成功的開始。
9、當(dāng)你沒有借口的那一刻,就是你成功的開始。
10、命運(yùn)是可以改變的。
11、成功者絕不放棄。
12、成功永遠(yuǎn)屬于馬上行動(dòng)的人。
13、下定決心一定要,才是成功的關(guān)鍵。
14、成功等于目標(biāo),其他都是這句話的注解。
15、成功是一個(gè)過(guò)程,并不是一個(gè)結(jié)果。
16、成功者學(xué)習(xí)別人的經(jīng)驗(yàn),一般人學(xué)習(xí)自己的經(jīng)驗(yàn)。
17、只有第一名可以教你如何成為第一名。
18、學(xué)習(xí)需要有計(jì)劃。
19、完全照成功者的方法來(lái)執(zhí)行。
20、九十九次的理論不如一次的行動(dòng)來(lái)得實(shí)際。
21、一個(gè)勝利者不會(huì)放棄,而一個(gè)放棄者永遠(yuǎn)不會(huì)勝利。
22、信心、毅力、勇氣三者具備,則天下沒有做不成的事。23、如果你想得到,你就會(huì)得到,你所需要付出的只是行動(dòng)。
24、一個(gè)缺口的杯子,如果換一個(gè)角度看它,它仍然是圓的。
25、對(duì)于每一個(gè)不利條件,都會(huì)存在與之相對(duì)應(yīng)的有利條件。
26、一個(gè)人的快樂(lè),不是因?yàn)樗麚碛械亩?,而是他?jì)較的少。
27、世間成事,不求其絕對(duì)圓滿,留一份不足,可得無(wú)限美好。
28記?。耗闶悄闵拇L(zhǎng);走自己的路,何必在乎其它。
29、你要做多大的事情,就該承受多大的壓力。
30、如果你相信自己,你可以做任何事。
31、天空黑暗到一定程度,星辰就會(huì)熠熠生輝。
32、時(shí)間順流而下,生活逆水行舟。
33、生活充滿了選擇,而生活的態(tài)度就是一切。
34、人各有志,自己的路自己走。
35、別人的話只能作為一種參考,是不能左右自己的。
36、成功來(lái)自使我們成功的信念。
37、相互了解是朋友,相互理解是知己。
38、沒有所謂失敗,除非你不再嘗試。
39、有時(shí)可能別人不在乎你,但你不能不在乎自己。
40、你必須成功,因?yàn)槟悴荒苁 ?/p>
41、羨慕別人得到的,不如珍惜自己擁有的。
42、喜歡一個(gè)人,就該讓他(她)快樂(lè)。
43、別把生活當(dāng)作游戲,誰(shuí)游戲人生,生活就懲罰誰(shuí),這不是勸誡,而是--規(guī)則!
44、你要求的次數(shù)愈多,你就越容易得到你要的東西,而且連帶地也會(huì)得到更多樂(lè)趣。
45、把氣憤的心境轉(zhuǎn)化為柔和,把柔和的心境轉(zhuǎn)化為愛,如此,這個(gè)世間將更加完美。
46、一份耕耘,一份收獲,付出就有回報(bào)永不遭遇過(guò)失敗,因我所碰到的都是暫時(shí)的挫折。
47、心如鏡,雖外景不斷變化,鏡面卻不會(huì)轉(zhuǎn)動(dòng),這就是一顆平常心,能夠景轉(zhuǎn)而心不轉(zhuǎn)。
48、每件事情都必須有一個(gè)期限,否則,大多數(shù)人都會(huì)有多少時(shí)間就花掉多少時(shí)間。
49、人,其實(shí)不需要太多的東西,只要健康地活著,真誠(chéng)地愛著,也不失為一種富有。
50、生命之長(zhǎng)短殊不重要,只要你活得快樂(lè),在有生之年做些有意義的事,便已足夠。
51、活在忙與閑的兩種境界里,才能俯仰自得,享受生活的樂(lè)趣,成就人生的意義。
52、一個(gè)從來(lái)沒有失敗過(guò)的人,必然是一個(gè)從未嘗試過(guò)什么的人。
53、待人退一步,愛人寬一寸,人生自然活得很快樂(lè)。
54、經(jīng)驗(yàn)不是發(fā)生在一個(gè)人身上的事件,而是一個(gè)人如何看待發(fā)生在他身上的事。
55、加倍努力,證明你想要的不是空中樓閣。勝利是在多次失敗之后才姍姍而來(lái)。1、用愛心來(lái)做事,用感恩的心做人。56大數(shù)據(jù)時(shí)代
大數(shù)據(jù)時(shí)代
57大數(shù)據(jù)培訓(xùn)知識(shí)(-)課件58大數(shù)據(jù)培訓(xùn)知識(shí)(-)課件59目錄大數(shù)據(jù)的背景大數(shù)據(jù)的定義大數(shù)據(jù)的分類大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)給我們帶來(lái)了什么大數(shù)據(jù)面臨的挑戰(zhàn)和趨勢(shì)大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)目錄大數(shù)據(jù)的背景60一、大數(shù)據(jù)時(shí)代的背景21世紀(jì)是數(shù)據(jù)信息大發(fā)展的時(shí)代,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大?;ヂ?lián)網(wǎng)(社交、搜索、電商)、移動(dòng)互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融(銀行、股市、保險(xiǎn))、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)?!按髷?shù)據(jù)”的誕生:半個(gè)世紀(jì)以來(lái),隨著計(jì)算機(jī)技術(shù)全面融入社會(huì)生活,信息爆炸已經(jīng)積累到了一個(gè)開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長(zhǎng)速度也在加快。信息爆炸式的增長(zhǎng),創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念*。如今,這個(gè)概念幾乎應(yīng)用到了所有人類智力與發(fā)展的領(lǐng)域中。一、大數(shù)據(jù)時(shí)代的背景21世紀(jì)是數(shù)據(jù)信息大發(fā)61全球每秒鐘發(fā)送2.9百萬(wàn)封電子郵件,一分鐘讀一篇的話,足夠一個(gè)人晝夜不息的讀5.5年…每天會(huì)有
2.88萬(wàn)個(gè)小時(shí)的視頻上傳到Y(jié)outube,足夠一個(gè)人晝夜不息的觀看3.3年…推特上每天發(fā)布5千萬(wàn)條消息,假設(shè)10秒鐘瀏覽一條信息,這些消息足夠一個(gè)人晝夜不息的瀏覽16年…每天亞馬遜上將產(chǎn)生6.3百萬(wàn)筆訂單…每個(gè)月網(wǎng)民在Facebook上要花費(fèi)7千億分鐘,被移動(dòng)互聯(lián)網(wǎng)使用者發(fā)送和接收的數(shù)據(jù)高達(dá)1.3EB…Google上每天需要處理24PB的數(shù)據(jù)…新的時(shí)代,人們從信息的被動(dòng)接受者變成了主動(dòng)創(chuàng)造者大數(shù)據(jù)時(shí)代到來(lái)全球每秒鐘發(fā)送2.9百萬(wàn)封電子郵件,一分鐘讀一篇的話,足62TBPBZBEB大量新數(shù)據(jù)源的出現(xiàn)則導(dǎo)致了非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式的增長(zhǎng)根據(jù)監(jiān)測(cè),人類產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級(jí)增長(zhǎng),大約每?jī)赡攴环?,這個(gè)速度在2020年之前會(huì)繼續(xù)保持下去。這意味著人類在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量數(shù)據(jù)量增加數(shù)據(jù)結(jié)構(gòu)日趨復(fù)雜這些由我們創(chuàng)造的信息背后產(chǎn)生的這些數(shù)據(jù)早已經(jīng)遠(yuǎn)遠(yuǎn)超越了目前人力所能處理的范疇大數(shù)據(jù)時(shí)代正在來(lái)臨..大數(shù)據(jù)時(shí)代到來(lái)TBPBZBEB大量新數(shù)據(jù)源的出現(xiàn)則導(dǎo)致了非結(jié)構(gòu)化、半結(jié)構(gòu)化63二、大數(shù)據(jù)的定義
在2012年的IT業(yè)界中,“大數(shù)據(jù)”(BigData)成了關(guān)注度不斷提高的關(guān)鍵詞之一。“大數(shù)據(jù)”是一個(gè)起源于歐美的詞匯。不過(guò),關(guān)于這個(gè)詞的起源時(shí)間并不是十分清楚。至今為止,最具影響力的說(shuō)法是2010年2月出版的?經(jīng)濟(jì)學(xué)家?(TheEconomist)雜志中的一篇題為“Thedatadeluge”的文章。其中,“deluge”的解釋是"數(shù)據(jù)洪流或海量數(shù)據(jù)"。那么,究竟何為大數(shù)據(jù)?一般來(lái)說(shuō),可以從狹義和廣義兩個(gè)層面來(lái)進(jìn)行理解。二、大數(shù)據(jù)的定義64狹義的大數(shù)據(jù)
狹義的大數(shù)據(jù)就是指用現(xiàn)在的一般技術(shù)難以管理的大量數(shù)據(jù)的集合。大數(shù)據(jù)不僅僅是容量大而已,可以用3v來(lái)描述大數(shù)據(jù)的特征:Volume(容量)、Variety(多樣性)、Velocity(速度)。1.容量也就是指數(shù)據(jù)量,基本上是指從幾十TB到幾PB這樣的數(shù)量級(jí);甚至可能發(fā)展到EB數(shù)量級(jí)。(1TB=1024GB,1PB=1024TB,1EB=1024PB)2.多樣性網(wǎng)站日志數(shù)據(jù)、Facebook等媒體中的文本數(shù)據(jù),智能手機(jī)中內(nèi)置的GPS所產(chǎn)生的位置信息,監(jiān)控?cái)z像機(jī)的視頻數(shù)據(jù)等。3.速度也就是數(shù)據(jù)產(chǎn)生和更新的頻率。狹義的大數(shù)據(jù)狹義的大數(shù)據(jù)就是指用現(xiàn)在的一般技術(shù)難以65廣義的大數(shù)據(jù)廣義的大數(shù)據(jù)是一個(gè)綜合性的概念,它包括因具備3v特征而難以進(jìn)行管理的數(shù)據(jù)對(duì)這些數(shù)據(jù)進(jìn)行存儲(chǔ)、處理、分析的技術(shù)能夠通過(guò)分析這些數(shù)據(jù)獲得實(shí)用意義和觀點(diǎn)的人才和組織這些人才和組織指的是目前在歐美十分緊俏的“數(shù)據(jù)科學(xué)家”這類人才,以及能夠?qū)Υ髷?shù)據(jù)進(jìn)行有效運(yùn)用的組織。由此廣義的概念可知,除了自身的特征外,人才的作用在大數(shù)據(jù)時(shí)代中日益突出。廣義的大數(shù)據(jù)廣義的大數(shù)據(jù)是一個(gè)綜合性的概念,它包括66三、大數(shù)據(jù)的分類按生產(chǎn)主體劃分按數(shù)據(jù)來(lái)源劃分按存儲(chǔ)形式劃分三、大數(shù)據(jù)的分類按生產(chǎn)主體劃分67少量企業(yè)應(yīng)用產(chǎn)生的數(shù)據(jù)關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)微博、微信電子商務(wù)在線交易日志數(shù)據(jù)評(píng)論、留言或者電話投訴等企業(yè)應(yīng)用的相關(guān)評(píng)論數(shù)據(jù)應(yīng)用服務(wù)器日志傳感器數(shù)據(jù)(天氣、水、智能電網(wǎng)等)圖像和視頻(攝像頭監(jiān)控?cái)?shù)據(jù)等)RFID、二維碼或條形碼掃描數(shù)據(jù)大量人產(chǎn)生的數(shù)據(jù)巨量機(jī)器產(chǎn)生的數(shù)據(jù)大數(shù)據(jù)的分類—按生產(chǎn)主體劃分少量企業(yè)應(yīng)用產(chǎn)生的數(shù)據(jù)關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)微博、微信應(yīng)用服務(wù)68
1、BAT為代表的互聯(lián)網(wǎng)公司。2、電信、金融、保險(xiǎn)、電力、石化系統(tǒng)。3、公共安全、醫(yī)療、交通領(lǐng)域。4、氣象、教育、地理、政務(wù)等。5、其他,商業(yè)銷售、制造業(yè)、農(nóng)業(yè)、物流和流通等領(lǐng)域。大數(shù)據(jù)分類—按數(shù)據(jù)來(lái)源劃分大數(shù)據(jù)分類—按數(shù)據(jù)來(lái)源劃分69阿里巴巴目前保存的數(shù)據(jù)量為近百PB擁有90%以上的電商數(shù)據(jù)交易數(shù)據(jù)、用戶瀏覽和點(diǎn)擊網(wǎng)頁(yè)數(shù)據(jù)、購(gòu)物數(shù)據(jù)2013數(shù)據(jù)總量接近一千個(gè)PB中文網(wǎng)頁(yè)、百度推廣、百度日志、UGC以70%以上的搜索市場(chǎng)份額坐擁龐大的搜索數(shù)據(jù)騰訊總存儲(chǔ)數(shù)據(jù)量經(jīng)壓縮處理以后在100PB左右數(shù)據(jù)量月增10%大量社交、游戲等領(lǐng)域積累的文本、音頻、視頻和關(guān)系類數(shù)據(jù)百度大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分BAT為代表的互聯(lián)網(wǎng)公司阿里巴巴目前保存的數(shù)據(jù)量為近百PB2013數(shù)據(jù)總量接近一千個(gè)70電信行業(yè)用戶上網(wǎng)記錄、通話、信息、地理位置運(yùn)營(yíng)商擁有的數(shù)據(jù)數(shù)量都在10PB以上年度用戶數(shù)據(jù)增長(zhǎng)約數(shù)十PB開戶信息數(shù)據(jù),銀行網(wǎng)點(diǎn)和在線交易數(shù)據(jù)、自身運(yùn)營(yíng)的數(shù)據(jù)金融系統(tǒng)每年產(chǎn)生數(shù)據(jù)達(dá)數(shù)十PB保險(xiǎn)系統(tǒng)數(shù)據(jù)量也接近PB級(jí)別電力與石化僅國(guó)家電網(wǎng)采集獲得的數(shù)據(jù)總量就上10個(gè)PB級(jí)別石油化工、智能水表等領(lǐng)域每年產(chǎn)生和保存下來(lái)的數(shù)據(jù)量也達(dá)到數(shù)十PB級(jí)別。金融與保險(xiǎn)大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分電信、金融與保險(xiǎn)、電力、石化系統(tǒng)電信行業(yè)用戶上網(wǎng)記錄、通話、信息、地理位置開戶信息數(shù)據(jù),銀行71公共安全北京:50萬(wàn)個(gè)監(jiān)控?cái)z像頭,每天采集視頻數(shù)據(jù)量約3PB整個(gè)視頻監(jiān)控每年保存下來(lái)的數(shù)據(jù)在數(shù)百PB以上僅廣州中山大學(xué)醫(yī)院2013年數(shù)據(jù)量為1000個(gè)TB整個(gè)醫(yī)療衛(wèi)生行業(yè)一年能夠保存下來(lái)的數(shù)據(jù)就可達(dá)到數(shù)百PB交通航班往返一次能產(chǎn)生數(shù)據(jù)就達(dá)到TB級(jí)別列車、水陸路運(yùn)輸產(chǎn)生的各種視頻、文本類數(shù)據(jù),每年保存下來(lái)的也達(dá)到數(shù)十PB。醫(yī)療衛(wèi)生大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分公共安全、醫(yī)療衛(wèi)生、交通領(lǐng)域公共安全北京:50萬(wàn)個(gè)監(jiān)控?cái)z像頭,每天采集視頻數(shù)據(jù)量約3PB72氣象與地理中國(guó)氣象局保存的數(shù)據(jù)約4~5PB,每年約增數(shù)百個(gè)TB各種地圖和地理位置信息每年約數(shù)十PB北京市政務(wù)數(shù)據(jù)資源網(wǎng)涵蓋旅游、教育、交通、醫(yī)療等門類,一年上線公布了400余個(gè)數(shù)據(jù)包政務(wù)數(shù)據(jù)多為結(jié)構(gòu)化數(shù)據(jù)政務(wù)與教育大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分氣象、地里、教育、政務(wù)等領(lǐng)域氣象與地理中國(guó)氣象局保存的數(shù)據(jù)約4~5PB,每年約增數(shù)百個(gè)T73大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分其他傳統(tǒng)行業(yè)線下商業(yè)銷售、農(nóng)林牧漁業(yè)、線下餐飲、食品、科研、物流運(yùn)輸?shù)刃袠I(yè)數(shù)據(jù)量劇增行業(yè)數(shù)據(jù)量還處于積累期,整個(gè)體量都不算大,多則達(dá)到PB級(jí)別,少則百TB甚至數(shù)十TB級(jí)別。制造業(yè)制造業(yè)的存儲(chǔ)數(shù)據(jù)類型:產(chǎn)品設(shè)計(jì)數(shù)據(jù):以文件為主,非結(jié)構(gòu)化,共享要求較高,保存時(shí)間較長(zhǎng)。企業(yè)生產(chǎn)環(huán)節(jié)的業(yè)務(wù)數(shù)據(jù):數(shù)據(jù)庫(kù)結(jié)構(gòu)化數(shù)據(jù)生產(chǎn)監(jiān)控?cái)?shù)據(jù):數(shù)據(jù)量非常大商業(yè)銷售、制造業(yè)、農(nóng)業(yè)、物流和流通等領(lǐng)域大數(shù)據(jù)分類——按數(shù)據(jù)來(lái)源劃分其他傳統(tǒng)行業(yè)線下商業(yè)銷售、農(nóng)林牧74大數(shù)據(jù)分類—按存儲(chǔ)形式劃分
大數(shù)據(jù)不僅僅體現(xiàn)數(shù)據(jù)量大,也體現(xiàn)在數(shù)據(jù)類型多。如此海量的數(shù)據(jù)中,僅有20%左右屬于結(jié)構(gòu)化數(shù)據(jù),80%的數(shù)據(jù)屬于廣泛存在于社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、電子商務(wù)等領(lǐng)域的非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)分類—按存儲(chǔ)形式劃分大數(shù)據(jù)不僅僅體現(xiàn)數(shù)據(jù)量75大數(shù)據(jù)分類——按存儲(chǔ)形式劃分即行數(shù)據(jù),可用二維表結(jié)構(gòu)來(lái)邏輯表達(dá)實(shí)現(xiàn)主要存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中先有結(jié)構(gòu)再有數(shù)據(jù),結(jié)構(gòu)一般不變處理起來(lái)較方便結(jié)構(gòu)化數(shù)據(jù)大數(shù)據(jù)分類——按存儲(chǔ)形式劃分即行數(shù)據(jù),可用二維表結(jié)構(gòu)來(lái)邏輯表76大數(shù)據(jù)分類——按存儲(chǔ)形式劃分相對(duì)于結(jié)構(gòu)化數(shù)據(jù)而言,不方便用數(shù)據(jù)庫(kù)二維邏輯表來(lái)表現(xiàn)非純文本類數(shù)據(jù),沒有標(biāo)準(zhǔn)格式包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息存儲(chǔ)在非結(jié)構(gòu)數(shù)據(jù)庫(kù)中非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù):突破了關(guān)系數(shù)據(jù)庫(kù)結(jié)構(gòu)定義不易改變和數(shù)據(jù)定長(zhǎng)的限制非結(jié)構(gòu)化數(shù)據(jù)大數(shù)據(jù)分類——按存儲(chǔ)形式劃分相對(duì)于結(jié)構(gòu)化數(shù)據(jù)而言,不方便用數(shù)77大數(shù)據(jù)分類——按存儲(chǔ)形式劃分介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的數(shù)據(jù)之間格式較為規(guī)范,一般都是純文本數(shù)據(jù)包括日志數(shù)據(jù)、XML、JSON等格式的數(shù)據(jù)一般是自描述的,數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容混在一起,沒有明顯的區(qū)分?jǐn)?shù)據(jù)模型主要為樹和圖的形式。半結(jié)構(gòu)化數(shù)據(jù)大數(shù)據(jù)分類——按存儲(chǔ)形式劃分介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的78四、大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用大數(shù)據(jù)在金融業(yè)的應(yīng)用大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用大數(shù)據(jù)在社會(huì)管理中的應(yīng)用四、大數(shù)據(jù)的應(yīng)用大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用79大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用IBM日本公司建立了一個(gè)經(jīng)濟(jì)指標(biāo)預(yù)測(cè)系統(tǒng),它從互聯(lián)網(wǎng)新聞中搜索出影響制造業(yè)的480項(xiàng)經(jīng)濟(jì)數(shù)據(jù),再計(jì)算出PMI預(yù)測(cè)值,準(zhǔn)確度相當(dāng)高。印第安納大學(xué)學(xué)者利用Google提供的心情分析工具,根據(jù)用戶近千萬(wàn)條短信、微博留言中預(yù)測(cè)道瓊斯工業(yè)指數(shù)。準(zhǔn)確率高達(dá)87%。淘寶網(wǎng)建立了“淘寶CPI”,它通過(guò)采集、編制淘寶網(wǎng)上390個(gè)類目的熱門商品價(jià)格來(lái)統(tǒng)計(jì)CPI,它比國(guó)家統(tǒng)計(jì)局公布的CPI還提前半個(gè)月預(yù)測(cè)經(jīng)濟(jì)的走勢(shì)。大數(shù)據(jù)在宏觀經(jīng)濟(jì)管理領(lǐng)域的應(yīng)用IBM日本公司建立了一個(gè)經(jīng)濟(jì)指80大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用Google前雇員創(chuàng)辦Climate公司,從美國(guó)氣象局等數(shù)據(jù)庫(kù)中獲得幾十年的天氣數(shù)據(jù),將各地的降雨、氣溫和土壤狀況及歷年農(nóng)作物產(chǎn)量做成精密圖表,從而能夠預(yù)測(cè)美國(guó)任一農(nóng)場(chǎng)下一年的產(chǎn)量。任何一個(gè)農(nóng)場(chǎng)主去他那里問(wèn)明年種什么能賣出去、能賺錢,他能告訴你,說(shuō)錯(cuò)了他保證賠償,賠償比保險(xiǎn)公司還要高,到現(xiàn)在為止他還沒有賠過(guò)。通過(guò)手機(jī)上農(nóng)產(chǎn)品“移動(dòng)支付”數(shù)據(jù)、“采購(gòu)?fù)度搿睌?shù)據(jù)和“補(bǔ)貼“數(shù)據(jù)分析,可準(zhǔn)確預(yù)測(cè)農(nóng)產(chǎn)品生產(chǎn)趨勢(shì),政府可依此決定出臺(tái)激勵(lì)措施和確定合適的作物存儲(chǔ)量,還可為農(nóng)民提供服務(wù)。大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用Google前雇員創(chuàng)辦Climate公81大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用沃爾瑪基于每個(gè)月4500萬(wàn)的網(wǎng)絡(luò)購(gòu)物數(shù)據(jù),并結(jié)合社交網(wǎng)絡(luò)上有關(guān)產(chǎn)品的大眾評(píng)分,開發(fā)機(jī)器學(xué)習(xí)語(yǔ)義搜索引擎“北極星“,方便瀏覽,在線購(gòu)物者因此增加10%-15%,增加銷售十多億美元。當(dāng)顧客在超市買東西時(shí),通過(guò)手機(jī)定位,可以分析他們?cè)谪浌袂巴A魰r(shí)間的長(zhǎng)短,從而判斷顧客對(duì)什么感興趣。不僅僅是通過(guò)手機(jī)定位,實(shí)際上美國(guó)有的超市在購(gòu)物推車上也安裝了位置傳感器,根據(jù)顧客在不同貨物前停留時(shí)間的長(zhǎng)短來(lái)分析顧客可能的購(gòu)物行為。在淘寶網(wǎng)上買東西時(shí),消費(fèi)者會(huì)在阿里的廣告交易平臺(tái)上留下記錄,阿里不僅從交易平臺(tái)把消費(fèi)記錄拿來(lái)自己使用,還會(huì)把消費(fèi)記錄賣給其他商家。大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用沃爾瑪基于每個(gè)月4500萬(wàn)的網(wǎng)絡(luò)購(gòu)物數(shù)82大數(shù)據(jù)在金融業(yè)的應(yīng)用華爾街某公司通過(guò)分析全球3.4億微博賬戶留言來(lái)判斷民眾情緒,人們高興的時(shí)候會(huì)買股票,而焦慮的時(shí)候會(huì)拋售股票,它通過(guò)判斷全世界高興的人多還是焦慮的人多,依此決定公司股票的買入或賣出。阿里公司根據(jù)在淘寶網(wǎng)上中小企業(yè)的交易狀況篩選出財(cái)務(wù)健康和誠(chéng)信經(jīng)營(yíng)的企業(yè),給他們提供貸款,并且不需要這些中小企業(yè)的擔(dān)保。目前阿里公司已放貸上千億元,壞帳率僅0.3%。2012年年底,四大商業(yè)銀行的壞賬率為1%左右,盡管四大銀行要求有擔(dān)保,但壞賬率仍然比阿里高出3倍。大數(shù)據(jù)在金融業(yè)的應(yīng)用華爾街某公司通過(guò)分析全球3.4億微博賬戶83大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用Google通過(guò)用戶搜索與流感相關(guān)詞匯的頻率,判斷某個(gè)地方可能會(huì)發(fā)生流感。2009年在甲型H1N1流感爆發(fā)的幾周前,Google就做出預(yù)測(cè),而且還判斷出了流感是從哪里來(lái)的。大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用Google通過(guò)用戶搜索與流感相關(guān)84大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用根據(jù)麥肯錫的報(bào)告,醫(yī)療大數(shù)據(jù)的分析將為美國(guó)產(chǎn)生3000億美元的價(jià)值,減少8%的國(guó)家醫(yī)療保健支出。大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用根據(jù)麥肯錫的報(bào)告,醫(yī)療大數(shù)據(jù)的分析85大數(shù)據(jù)在社會(huì)管理中的應(yīng)用廣東東莞通過(guò)統(tǒng)計(jì)當(dāng)?shù)厥雏}銷售量與上年同期比較,判斷農(nóng)民工數(shù)量的變化。這與電信運(yùn)營(yíng)商根據(jù)活躍移動(dòng)用戶數(shù)的變化所推出的數(shù)據(jù)幾乎相當(dāng)。根據(jù)手機(jī)用戶從這個(gè)路口到那個(gè)路口所花費(fèi)的時(shí)間,可以判斷馬路上是不是流量比較多,是否擁堵。根據(jù)有多少個(gè)手機(jī)在同時(shí)移動(dòng),大致可以了解發(fā)生突發(fā)事件時(shí)的人流聚集情況,還可以通過(guò)手機(jī)的注冊(cè)地進(jìn)一步分析機(jī)主究竟是從哪里來(lái)的。騰訊為每個(gè)微博用戶建立了檔案,可以從微博帖子分析用戶的性格,提前關(guān)注可能引起社會(huì)不穩(wěn)定的因素。大數(shù)據(jù)在社會(huì)管理中的應(yīng)用廣東東莞通過(guò)統(tǒng)計(jì)當(dāng)?shù)厥雏}銷售量與上年86五、大數(shù)據(jù)帶來(lái)了什么?大數(shù)據(jù)既催生出無(wú)數(shù)新的服務(wù)和商業(yè)模式,也讓一些傳統(tǒng)行業(yè)找到了新的機(jī)會(huì),同時(shí)產(chǎn)生了對(duì)“數(shù)據(jù)科學(xué)家”這種新興復(fù)合型人才的迫切需求。但是,數(shù)據(jù)運(yùn)用和隱私保護(hù)之間到底應(yīng)該如何權(quán)衡,也成了一個(gè)令各方勢(shì)力爭(zhēng)論不休的話題。所以,對(duì)于大數(shù)據(jù)帶來(lái)的影響,必須從積極影響和消極影響兩個(gè)層面來(lái)分析。五、大數(shù)據(jù)帶來(lái)了什么?大數(shù)據(jù)既催生出無(wú)數(shù)新的服務(wù)和87積極影響
首先,大數(shù)據(jù)有利于推動(dòng)中國(guó)新四化轉(zhuǎn)型。新四化是指新型工業(yè)化、信息化、城鎮(zhèn)化和農(nóng)業(yè)現(xiàn)代化。大數(shù)據(jù)將會(huì)改變?nèi)祟惿钌a(chǎn)方式,可以為新四化提供轉(zhuǎn)變發(fā)展方式的新動(dòng)力。1.大數(shù)據(jù)可以強(qiáng)力啟動(dòng)內(nèi)需;2.大數(shù)據(jù)可以推動(dòng)城鎮(zhèn)化以智慧城市的新方式發(fā)展;3.大數(shù)據(jù)有利于改進(jìn)政府管理方式;4.大數(shù)據(jù)產(chǎn)業(yè)將會(huì)形成新的增長(zhǎng)點(diǎn)。
積極影響首先,大數(shù)據(jù)有利于推動(dòng)中國(guó)新四化轉(zhuǎn)型。88
其次,大數(shù)據(jù)將對(duì)微觀經(jīng)濟(jì)產(chǎn)生重大影響。
IBM的CEO羅睿蘭說(shuō):“數(shù)據(jù)將是下一個(gè)大的自然資源,將會(huì)區(qū)分每個(gè)行業(yè)的勝者與輸家?!盜BM的全球調(diào)查顯示:表現(xiàn)優(yōu)秀的企業(yè)使用分析技術(shù)的數(shù)量比表現(xiàn)較差的企業(yè)高五倍。1.未來(lái)以政府、電信、教育、醫(yī)療、金融、石油石化和電力等行業(yè)為重點(diǎn)的大數(shù)據(jù)應(yīng)用,將直接拉動(dòng)整個(gè)社會(huì)的應(yīng)用規(guī)模;2.數(shù)據(jù)業(yè)務(wù)將成為各行各業(yè)的主營(yíng)業(yè)務(wù),圍繞大數(shù)據(jù),企業(yè)將向分析級(jí)服務(wù)升級(jí)轉(zhuǎn)型,從而改變各行各業(yè)的業(yè)態(tài);3.廣義的分析級(jí)服務(wù)得到大發(fā)展,包含一切以大數(shù)據(jù)為基礎(chǔ)的高附加值的創(chuàng)新型服務(wù)。其次,大數(shù)據(jù)將對(duì)微觀經(jīng)濟(jì)產(chǎn)生重大影響。89
再次,大數(shù)據(jù)的發(fā)展有利于促進(jìn)新興職業(yè)的發(fā)展。
在大數(shù)據(jù)浪潮的沖擊下,一門新興職業(yè)即“數(shù)據(jù)分析師”(數(shù)據(jù)科學(xué)家)正在以勢(shì)不可擋的氣勢(shì)涌現(xiàn)。大數(shù)據(jù)使勞動(dòng)力市場(chǎng)迅速出現(xiàn)了變化,數(shù)據(jù)分析師成為炙手可熱的行業(yè)。麥肯錫全球研究所進(jìn)行過(guò)一次調(diào)查,根據(jù)調(diào)查預(yù)計(jì),美國(guó)需要14萬(wàn)名至19萬(wàn)名以上具備深度分析專長(zhǎng)的人員。而對(duì)具備數(shù)據(jù)知識(shí)的經(jīng)理的需求量超過(guò)150萬(wàn)名。一個(gè)在業(yè)界不可言喻的現(xiàn)象出現(xiàn)了,數(shù)據(jù)分析師已經(jīng)能夠成為最為搶手的熱門職業(yè)。
再次,大數(shù)據(jù)的發(fā)展有利于促進(jìn)新興職業(yè)的發(fā)展。90消極影響
關(guān)于大數(shù)據(jù)所帶來(lái)的消極影響主要表現(xiàn)為大數(shù)據(jù)運(yùn)用和隱私保護(hù)之間的矛盾。要在業(yè)務(wù)中對(duì)大數(shù)據(jù)進(jìn)行運(yùn)用,就不可避免的會(huì)遇到隱私問(wèn)題。
首先,對(duì)web上的用戶個(gè)人信息、行為記錄等進(jìn)行收集,在未經(jīng)用戶許可的情況下將數(shù)據(jù)轉(zhuǎn)讓給廣告商等第三方,這種行為嚴(yán)重侵犯了用戶的個(gè)人隱私權(quán),而且會(huì)對(duì)其造成一定程度的危害;其次,網(wǎng)頁(yè)上的行為記錄,如瀏覽記錄和購(gòu)買記錄等,如果進(jìn)行了相當(dāng)數(shù)量的積累,則有可能據(jù)此推斷出個(gè)人的興趣、愛好、思想傾向等。而對(duì)于用戶來(lái)說(shuō),他們很不希望這些信息被別人知道,所以在心理上會(huì)感覺到自己的隱私受到了侵犯。消極影響關(guān)于大數(shù)據(jù)所帶來(lái)的消極影響主要表現(xiàn)為91
在今天,關(guān)于隱私是一個(gè)很大的問(wèn)題,而且以后這個(gè)問(wèn)題還會(huì)越來(lái)越嚴(yán)重,會(huì)被人們高度關(guān)注。所以,對(duì)于企業(yè)來(lái)說(shuō),不僅要遵守正式法律的限制,而且不能逾越顧客所能接受的最低底線。必須時(shí)刻把用戶的地位放在首位,盡可能的多為顧客提供便利,盡最大努力贏得用戶的理解和支持。在今天,關(guān)于隱私是一個(gè)很大的問(wèn)題,而且以后這個(gè)92六、大數(shù)據(jù)面臨的挑戰(zhàn)和趨勢(shì)
從大數(shù)據(jù)帶來(lái)的影響可知,大數(shù)據(jù)浪潮既是一種機(jī)遇也是一種挑戰(zhàn),必須權(quán)衡利弊。
趨勢(shì)隨著大數(shù)據(jù)浪潮的加速到來(lái),將出現(xiàn)產(chǎn)業(yè)鏈的整體繁榮。如何在大數(shù)據(jù)浪潮的洗禮中確保技術(shù)架構(gòu)、人才、政府和企業(yè)戰(zhàn)略以及商業(yè)模式能夠“逐浪潮頭”,將更需要積極主動(dòng)的選擇合適的技術(shù)、方法論、解決方案和發(fā)展策略等。六、大數(shù)據(jù)面臨的挑戰(zhàn)和趨勢(shì)從大數(shù)據(jù)帶來(lái)的影響可93
環(huán)顧整個(gè)市場(chǎng),我們?cè)谀承╊I(lǐng)域已經(jīng)取得了突破性進(jìn)展,但是,仍然面臨著大量挑戰(zhàn)。例如:研發(fā)分析各種多元結(jié)構(gòu)化數(shù)據(jù)的高效技術(shù),提高大數(shù)據(jù)分析的易用性,讓大數(shù)據(jù)分析技術(shù)實(shí)現(xiàn)“開箱即用”,使得數(shù)據(jù)分析成為政府和企業(yè)建立核心競(jìng)爭(zhēng)力的關(guān)鍵途徑。另外,具備高端數(shù)據(jù)分析技能,能夠從堆積如山的大量數(shù)據(jù)中找到金礦,并能夠?qū)?shù)據(jù)的價(jià)值以易懂的方式傳達(dá)給決策者,最終得以在業(yè)務(wù)上實(shí)現(xiàn)的人才即數(shù)據(jù)科學(xué)家是千金難求的。挑戰(zhàn)挑戰(zhàn)94七、大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)大數(shù)據(jù)時(shí)代就不需要統(tǒng)計(jì)了嗎?有人認(rèn)為大數(shù)據(jù)時(shí)代,數(shù)據(jù)的來(lái)源更加直接、多元,并且數(shù)據(jù)的“樣本=總體”,想要的結(jié)論直接就能看出來(lái),已經(jīng)不需要統(tǒng)計(jì)了。
這種認(rèn)知,顯然是錯(cuò)誤的七、大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)大數(shù)據(jù)時(shí)代就不需要統(tǒng)計(jì)了嗎?95首先,并不是所有的數(shù)據(jù)都可以直接在網(wǎng)絡(luò)上得到的,很多數(shù)據(jù)需要統(tǒng)計(jì)部門組織專業(yè)的調(diào)查才能得到,比如,農(nóng)業(yè)生產(chǎn)方面的數(shù)據(jù)、人口分布等等。其次,大數(shù)據(jù)告知信息,但不解釋數(shù)據(jù),即使把大數(shù)據(jù)的信息公布出來(lái),大部分民眾依然不知道數(shù)據(jù)要表達(dá)的信息。統(tǒng)計(jì)依然是數(shù)據(jù)分析的靈魂。首先,并不是所有的數(shù)據(jù)都可以直接在網(wǎng)絡(luò)上得到的,很多96大數(shù)據(jù)時(shí)代的到來(lái),給統(tǒng)計(jì)帶來(lái)機(jī)遇,也帶來(lái)了挑戰(zhàn)。2014年1月,國(guó)家統(tǒng)計(jì)局網(wǎng)上轉(zhuǎn)載了“中國(guó)統(tǒng)計(jì),‘向大數(shù)據(jù)時(shí)代’邁進(jìn)!”(
/tjgz/tjdt/201401/t20140108_497003.html)那么,大數(shù)據(jù)時(shí)代到底給統(tǒng)計(jì)帶來(lái)了那些沖擊和挑戰(zhàn)?大數(shù)據(jù)時(shí)代的到來(lái),給統(tǒng)計(jì)帶來(lái)機(jī)遇,也帶來(lái)了挑戰(zhàn)。971.大數(shù)據(jù)對(duì)統(tǒng)計(jì)的沖擊對(duì)統(tǒng)計(jì)理念的沖擊對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊對(duì)政府統(tǒng)計(jì)職能的沖擊1.大數(shù)據(jù)對(duì)統(tǒng)計(jì)的沖擊對(duì)統(tǒng)計(jì)理念的沖擊98對(duì)統(tǒng)計(jì)理念的沖擊1.大數(shù)據(jù)改變了數(shù)據(jù)的需求層次過(guò)去,由于人類的認(rèn)知能力有限,獲取大范圍數(shù)據(jù)比較困難,傳統(tǒng)的統(tǒng)計(jì)是通過(guò)觀察一小部分樣本來(lái)推測(cè)總體,但是推測(cè)的數(shù)據(jù)反映的是總體趨勢(shì),往往無(wú)法應(yīng)用到個(gè)體。大數(shù)據(jù)時(shí)代的來(lái)臨,使人類可以有機(jī)會(huì)和條件在非常多的領(lǐng)域和非常深入的層次獲得全面數(shù)據(jù),在此基礎(chǔ)上形成的的數(shù)據(jù)可以更加偏向個(gè)體情況,更加符合個(gè)體的感知,滿足個(gè)性化需求。對(duì)統(tǒng)計(jì)理念的沖擊1.大數(shù)據(jù)改變了數(shù)據(jù)的需求層次99對(duì)統(tǒng)計(jì)理念的沖擊2.大數(shù)據(jù)改變了統(tǒng)計(jì)實(shí)證的研究范式傳統(tǒng)的統(tǒng)計(jì)遵循自上而下的實(shí)證研究范式,即先從經(jīng)濟(jì)理論或社會(huì)經(jīng)驗(yàn)出發(fā),根據(jù)理論設(shè)定指標(biāo),再去利用統(tǒng)計(jì)數(shù)據(jù)進(jìn)行實(shí)證分析。然而大數(shù)據(jù)采用的是自下而上的數(shù)據(jù)挖掘范式,以數(shù)據(jù)為先導(dǎo)從大量的實(shí)際數(shù)據(jù)中挖掘數(shù)據(jù)之間的關(guān)系并建立模型,乃至形成理論和新的認(rèn)知。這種研究范式是對(duì)傳統(tǒng)統(tǒng)計(jì)研究范式的一種顛覆。對(duì)統(tǒng)計(jì)理念的沖擊2.大數(shù)據(jù)改變了統(tǒng)計(jì)實(shí)證的研究范式100對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊制度設(shè)計(jì)的多樣化傳統(tǒng)的統(tǒng)計(jì)設(shè)計(jì)是根據(jù)統(tǒng)計(jì)研究的目的和研究對(duì)象的特點(diǎn),設(shè)定統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)報(bào)表以及調(diào)查、匯總方法等制度,通過(guò)調(diào)查、訪問(wèn)將生產(chǎn)行為轉(zhuǎn)化為可量化的數(shù)據(jù)。
大數(shù)據(jù)下的制度,面對(duì)的是已存在的或者通過(guò)一定手段可以獲取的大量數(shù)據(jù),需要解決的問(wèn)題是怎么用這些數(shù)據(jù)。對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊制度設(shè)計(jì)的多樣化101對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)采集智能化傳統(tǒng)的統(tǒng)計(jì)是通過(guò)結(jié)構(gòu)化的報(bào)表和統(tǒng)一的計(jì)量方式將調(diào)查對(duì)象的行為轉(zhuǎn)化為可用的數(shù)據(jù),需要被調(diào)查者的參與,一旦調(diào)查對(duì)象不配合,或者采用虛報(bào)、瞞報(bào)、亂報(bào)的方式消極配合,統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量難以控制,并且矯正這些調(diào)查誤差的成本很高。
大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)講大大提高數(shù)據(jù)采集的智能化水平,數(shù)據(jù)來(lái)源于信息技術(shù)記錄下的原始數(shù)據(jù),想要篡改這些數(shù)據(jù)非常困難,數(shù)據(jù)的質(zhì)量將會(huì)大大提高。對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)采集智能化102對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)分析專業(yè)化傳統(tǒng)的統(tǒng)計(jì)分析是根據(jù)統(tǒng)計(jì)制度設(shè)計(jì)的要求以及研究對(duì)象的認(rèn)知,對(duì)采集上來(lái)的結(jié)構(gòu)化統(tǒng)計(jì)數(shù)據(jù)進(jìn)行計(jì)算分析,重點(diǎn)描述過(guò)去的這段時(shí)間發(fā)生的變化,對(duì)未來(lái)的發(fā)展情況進(jìn)行統(tǒng)計(jì)意義上的預(yù)測(cè)。大數(shù)據(jù)背景下的數(shù)據(jù)分析,面對(duì)的大量的已存在于計(jì)算機(jī)、網(wǎng)絡(luò)中的海量數(shù)據(jù),所要做的是分析挖掘數(shù)據(jù)之間的內(nèi)在關(guān)系,尋找更多有價(jià)值的信息,在這種背景下,需要專業(yè)化的數(shù)據(jù)挖掘與處理技術(shù)對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)分析專業(yè)化103對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)發(fā)布透明化大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)的大量存儲(chǔ)和共享,統(tǒng)計(jì)數(shù)據(jù)發(fā)布的公開透明程度將會(huì)極高,沒有公開詳細(xì)、公允計(jì)算方法的數(shù)據(jù)將會(huì)被其他數(shù)據(jù)替代。在發(fā)布結(jié)果上,僅僅告訴個(gè)別人結(jié)果,是遠(yuǎn)遠(yuǎn)不夠的,還需要通過(guò)可視化、交互等方式給予用戶更加方便、高效的使用方式,提供更為詳盡的信息。對(duì)統(tǒng)計(jì)生產(chǎn)流程的沖擊數(shù)據(jù)發(fā)布透明化104對(duì)政府統(tǒng)計(jì)職能的沖擊大數(shù)據(jù)時(shí)代,各種數(shù)據(jù)信息網(wǎng)絡(luò)平臺(tái)全面覆蓋,每個(gè)社會(huì)單位都是數(shù)據(jù)的生產(chǎn)者和提供者,數(shù)據(jù)存儲(chǔ)于信息平臺(tái)的所有者手中,政府統(tǒng)計(jì)機(jī)構(gòu)不再是數(shù)據(jù)的絕對(duì)擁有者,也不再是數(shù)據(jù)的唯一發(fā)布者和解釋人。如果政府統(tǒng)計(jì)機(jī)構(gòu)繼續(xù)在靜態(tài)的框架下封閉運(yùn)行,就無(wú)法反映經(jīng)濟(jì)社會(huì)發(fā)展的變化情況,無(wú)法實(shí)現(xiàn)統(tǒng)計(jì)信息、統(tǒng)計(jì)咨詢和實(shí)行統(tǒng)計(jì)監(jiān)督功能,勢(shì)必被邊緣化對(duì)政府統(tǒng)計(jì)職能的沖擊大數(shù)據(jù)時(shí)代,各種數(shù)據(jù)信息網(wǎng)絡(luò)平臺(tái)1052.大數(shù)據(jù)時(shí)代政府統(tǒng)計(jì)的發(fā)展趨勢(shì)大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)應(yīng)該成為社會(huì)經(jīng)濟(jì)發(fā)展的權(quán)威、全面數(shù)據(jù)的主要提供者,是政府掌握的有關(guān)社會(huì)管理和運(yùn)行的行政記錄信息標(biāo)準(zhǔn)規(guī)范制定者和數(shù)據(jù)結(jié)果發(fā)布者。政府統(tǒng)計(jì)應(yīng)整合多方行政記錄信息,結(jié)合自身采集數(shù)據(jù)補(bǔ)充,構(gòu)建權(quán)威的社會(huì)經(jīng)濟(jì)數(shù)據(jù)在線平臺(tái)。作為數(shù)據(jù)整合發(fā)布的維護(hù)部門。
2.大數(shù)據(jù)時(shí)代政府統(tǒng)計(jì)的發(fā)展趨勢(shì)大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)1063.借力大數(shù)據(jù)加速政府統(tǒng)計(jì)改改為了轉(zhuǎn)變政府統(tǒng)計(jì)的角色,需要全面改進(jìn)當(dāng)前的政府統(tǒng)計(jì)在獲取、整理和分析客觀事物總體數(shù)量方面的資料的工作過(guò)程,重塑統(tǒng)計(jì)基礎(chǔ)、強(qiáng)化技術(shù)支承、推動(dòng)應(yīng)用社會(huì)化,全面提升
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 美容行業(yè)中的團(tuán)隊(duì)合作與協(xié)調(diào)技巧試題及答案
- 防學(xué)校欺凌課件
- 食品檢驗(yàn)實(shí)驗(yàn)室的設(shè)備與試題及答案
- 公共事業(yè)管理考點(diǎn)分析試題及答案
- 2024-2025學(xué)年河南省駐馬店新蔡一高高一下學(xué)期2月月考物理試題及答案
- 計(jì)算機(jī)基礎(chǔ)考試技巧與實(shí)例試題及答案
- 大學(xué)古代文學(xué)史的評(píng)估試題及答案
- 拼寫誤差影響的分析試題及答案
- 2024年CPBA商業(yè)分析師模擬考試題目及答案
- 2024年汽車美容師市場(chǎng)需求分析試題及答案
- 《光伏發(fā)電工程預(yù)可行性研究報(bào)告編制規(guī)程》(NB/T32044-2018)中文版
- 老人夏季腹瀉預(yù)防和治療
- 安全警示教育護(hù)理課件
- 類風(fēng)濕關(guān)節(jié)炎病情活動(dòng)度評(píng)價(jià)表(DAS28)
- A4紙筆記本橫格線條打印模板
- 【施工組織設(shè)計(jì)】?jī)?nèi)容完整性和編制水平
- 2023公路橋梁鋼結(jié)構(gòu)防腐涂裝技術(shù)條件
- (13)-2.7科學(xué)把握理想與現(xiàn)實(shí)的辯證統(tǒng)一
- Unit5Poems單元分析講義高中英語(yǔ)人教版選擇性
- 青島版六年級(jí)數(shù)學(xué)上冊(cè) (完美的圖形)教學(xué)課件(第1課時(shí))
- 2022新能源光伏發(fā)電工程竣工決算報(bào)告模板
評(píng)論
0/150
提交評(píng)論