大數(shù)據(jù)蘊(yùn)含大價(jià)值_第1頁(yè)
大數(shù)據(jù)蘊(yùn)含大價(jià)值_第2頁(yè)
大數(shù)據(jù)蘊(yùn)含大價(jià)值_第3頁(yè)
大數(shù)據(jù)蘊(yùn)含大價(jià)值_第4頁(yè)
大數(shù)據(jù)蘊(yùn)含大價(jià)值_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)蘊(yùn)含大價(jià)值河北移動(dòng)業(yè)務(wù)支撐中心目錄河北移動(dòng)的機(jī)會(huì)應(yīng)對(duì)大數(shù)據(jù)的技術(shù)2什么是大數(shù)據(jù)?13“大數(shù)據(jù)”和“小數(shù)據(jù)”的不同思考?為什么現(xiàn)在會(huì)有“大數(shù)據(jù)”,以前難道沒(méi)有?為什么現(xiàn)在大數(shù)據(jù)傾向用專門的解決方案,為什么以前不?為什么大數(shù)據(jù)發(fā)源于互聯(lián)網(wǎng),而不是傳統(tǒng)數(shù)據(jù)密集型企業(yè)?大數(shù)據(jù)解決方案要深度定制,但是…人:硬件人員、Hadoop平臺(tái)人員、工具人員、運(yùn)維人員×31物:何種節(jié)點(diǎn)的規(guī)模才能達(dá)到規(guī)模效應(yīng)?幾個(gè)節(jié)點(diǎn)的Hadoop算不算大數(shù)據(jù)?云計(jì)算的資源動(dòng)態(tài)調(diào)配如何實(shí)現(xiàn)?基于性價(jià)比的選擇買產(chǎn)品:如果定制的效益不如付出的成本,那么采購(gòu)標(biāo)準(zhǔn)的第三方產(chǎn)品是更好的選擇?!靶?shù)據(jù)”大多是這類情況定制:如果定制的效益超過(guò)付出的成本,那么傾向自己進(jìn)行定制。比如Google、Facebook等VS我們的選擇?“大數(shù)據(jù)BigData”很熱門“大數(shù)據(jù)BigData”,大概是爆紅速度僅次于云計(jì)算的科技新名詞,過(guò)去一年來(lái),云計(jì)算雖然還是很熱門的話題,但更熱門的是大數(shù)據(jù),情況就像幾年前廠商不約而同在談云計(jì)算一樣。業(yè)界逐步開(kāi)始區(qū)分大數(shù)據(jù)和云計(jì)算兩個(gè)概念。前者主要指業(yè)務(wù)問(wèn)題、創(chuàng)新機(jī)會(huì)和技術(shù)平臺(tái),后者主要指按需付費(fèi)、資源動(dòng)態(tài)調(diào)配、自服務(wù)的商業(yè)模式。從大數(shù)據(jù)BigData和云計(jì)算CloudComputing在Google上的搜索趨勢(shì)(100代表最大搜索量)上看,對(duì)大數(shù)據(jù)的關(guān)注已經(jīng)逐步超過(guò)了云計(jì)算。對(duì)大數(shù)據(jù)的需求主要集中在分析Analytics和使用方面。Gartner:HypeCycleforEmergingTechnologies,2012典型的大數(shù)據(jù)傳感器RFID從2005年的1.3億增加到2010年的30億互聯(lián)網(wǎng)Google每天處理大約24PB的數(shù)據(jù)社交網(wǎng)絡(luò)Facebook每天處理25TB的數(shù)據(jù)Twitter每天處理7TB的數(shù)據(jù)電信中國(guó)移動(dòng)每天產(chǎn)生10TB+話單、30TB+上網(wǎng)日志和100TB+信令數(shù)據(jù)金融每交易周期,紐約證券交易所捕獲1TB的交易信息零售沃爾瑪每小時(shí)要處理100萬(wàn)筆電子交易記錄科研歐洲核子研究中心的強(qiáng)子對(duì)撞機(jī)每秒產(chǎn)生40TB數(shù)據(jù)政府美國(guó)政府擁有848PB數(shù)據(jù),居于美國(guó)第二位數(shù)據(jù)量井噴,據(jù)統(tǒng)計(jì),全球90%的數(shù)據(jù)都是在過(guò)去兩年中生成的。互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、傳感器、科研、金融正在產(chǎn)生越來(lái)越多的數(shù)據(jù)?;ヂ?lián)網(wǎng)上的一分鐘大數(shù)據(jù)的特征——3V有人說(shuō)大數(shù)據(jù)的特征是3V,有的說(shuō)是3V+1V(價(jià)值),有的說(shuō)是3V+1C(處理復(fù)雜性),但是3V是跑不了的,這些體現(xiàn)了大數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù)的特點(diǎn)。數(shù)據(jù)大(Volume),例如Facebook每天在30萬(wàn)臺(tái)服務(wù)器上處理25Tb數(shù)據(jù)時(shí)效性要求高(Velocity),例如搜索引擎要求在幾分鐘內(nèi)為用戶查詢新聞種類和來(lái)源多樣化(Variety),除了結(jié)構(gòu)化的數(shù)據(jù)、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)大量產(chǎn)生大數(shù)據(jù)眾生態(tài)在全球經(jīng)濟(jì)的很多領(lǐng)域,大數(shù)據(jù)在以很多的方式創(chuàng)造價(jià)值。事實(shí)上,研究表明:隨著消費(fèi)者、公司、各個(gè)經(jīng)濟(jì)領(lǐng)域不斷挖掘大數(shù)據(jù)的潛力,我們正處在一個(gè)巨大的浪潮的尖峰,這個(gè)浪潮,就是大數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新、生產(chǎn)效率提高、經(jīng)濟(jì)增長(zhǎng)以及新的競(jìng)爭(zhēng)形式和新的價(jià)值的產(chǎn)生?!洞髷?shù)據(jù):下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)率的前沿》麥肯錫全球研究所2011年5月在對(duì)全球100個(gè)國(guó)家及地區(qū)從事30個(gè)行業(yè)的3000名高管進(jìn)行的調(diào)查中,有60%的受訪者表示無(wú)法有效利用所有數(shù)據(jù)。而近期IBM對(duì)64個(gè)國(guó)家及地區(qū)從事19個(gè)行業(yè)的1700名首席營(yíng)銷官開(kāi)展的最新調(diào)查更是進(jìn)一步體現(xiàn)了出這個(gè)問(wèn)題的嚴(yán)峻性:調(diào)查結(jié)果顯示,71%的首席營(yíng)銷官表示他們的企業(yè)沒(méi)有做好充分準(zhǔn)備來(lái)應(yīng)對(duì)大數(shù)據(jù)的挑戰(zhàn)。

——《IBM-麻省理工斯隆管理學(xué)院評(píng)論》2011年大數(shù)據(jù)不是一個(gè)單獨(dú)的市場(chǎng),它無(wú)處不在,以一切可以想象出的方式影響著商業(yè)。大數(shù)據(jù)的涌入將迫使產(chǎn)品、業(yè)務(wù)和解決方案發(fā)生變化。這種變化非???,企業(yè)可能不得不淘汰要求的現(xiàn)有解決方案。2012年大數(shù)據(jù)將直接或間接拉動(dòng)全球960億美元IT支出,預(yù)計(jì)這一數(shù)據(jù)2013年將達(dá)到1200億美元,2016年達(dá)到2320億美元。新支出將流向社交媒體、社交網(wǎng)絡(luò)分析和內(nèi)容分析。支持大數(shù)據(jù)需要使用大量服務(wù),高達(dá)軟件采購(gòu)支出的20倍。擁有相應(yīng)技能的人才非常稀缺,但需求旺盛?!狦artner2012年10月大數(shù)據(jù)各家看點(diǎn)有人認(rèn)為大數(shù)據(jù)是大麻煩,有人認(rèn)為大數(shù)據(jù)是大挑戰(zhàn),有人認(rèn)為大數(shù)據(jù)是大機(jī)遇。還有大知識(shí)、大科技、大利潤(rùn)、大發(fā)展…麻煩各種各樣的海量數(shù)據(jù),從來(lái)不刪除數(shù)據(jù),對(duì)并發(fā)讀取、寫入的要求極高,每次可能訪問(wèn)上PB的數(shù)據(jù),真麻煩!挑戰(zhàn)傳統(tǒng)數(shù)據(jù)庫(kù)、小型機(jī)、陣列不是為了大數(shù)據(jù)的業(yè)務(wù)需求設(shè)計(jì)的,非常吃力,成本高,根本無(wú)法支撐。是一個(gè)挑戰(zhàn)!機(jī)遇在大數(shù)據(jù)的時(shí)代,數(shù)據(jù)就是直接的財(cái)富、就是核心的競(jìng)爭(zhēng)力,很多行業(yè),都要相繼跨入一個(gè)數(shù)據(jù)興則企業(yè)興、數(shù)據(jù)強(qiáng)則企業(yè)強(qiáng)的競(jìng)爭(zhēng)時(shí)代!大數(shù)據(jù)已經(jīng)經(jīng)上升到美美國(guó)政府國(guó)國(guó)家戰(zhàn)略2010年12月,總統(tǒng)行行政辦公室室下屬的科科技技術(shù)顧顧問(wèn)委員會(huì)會(huì),信息技技術(shù)顧問(wèn)委委員會(huì)向奧奧巴馬和國(guó)國(guó)會(huì)提交了了《規(guī)劃數(shù)據(jù)未未來(lái)》的專門報(bào)告告,該報(bào)告告把數(shù)據(jù)收收集和使用用的工作,,提到了戰(zhàn)戰(zhàn)略的高度度?!叭绾魏问占⒈14妗⒕S護(hù)護(hù)、管理、、分析、共共享正在呈呈指數(shù)數(shù)級(jí)級(jí)增增長(zhǎng)長(zhǎng)的數(shù)數(shù)據(jù)據(jù)是是我我們們必必須須面面對(duì)對(duì)的的一一個(gè)個(gè)重重要要挑挑戰(zhàn)戰(zhàn)。如如何何保證證這這些些數(shù)數(shù)據(jù)據(jù)現(xiàn)現(xiàn)在在、、將將來(lái)來(lái)的的完整整性性和和可可用用性性,我們們面臨臨著很多多的的問(wèn)問(wèn)題題和和挑挑戰(zhàn)戰(zhàn)。。如如何何使用用這些些數(shù)數(shù)據(jù)據(jù),,則則是是另另外外一一個(gè)個(gè)挑挑戰(zhàn)戰(zhàn)。。。。。。。應(yīng)對(duì)對(duì)好這些些挑挑戰(zhàn)戰(zhàn),,將將引引導(dǎo)導(dǎo)我我們們?cè)谠诳瓶蒲醒?、、醫(yī)醫(yī)療療、、商商業(yè)業(yè)和和國(guó)國(guó)家家安安全全方方面面開(kāi)開(kāi)創(chuàng)創(chuàng)新新的的成成功功。”2012年3月29日,,奧奧巴巴馬馬政政府府又又進(jìn)進(jìn)一一步步推推進(jìn)進(jìn)了了其其““大大數(shù)數(shù)據(jù)據(jù)戰(zhàn)戰(zhàn)略略””。。奧奧巴巴馬馬的的高高級(jí)級(jí)顧顧問(wèn)問(wèn)、、總總統(tǒng)統(tǒng)科科學(xué)學(xué)技技術(shù)術(shù)顧顧問(wèn)問(wèn)委委員員會(huì)會(huì)的的主主席席霍霍爾爾德德倫倫代代表表國(guó)國(guó)防防部部、、能能源源部部等等6個(gè)聯(lián)邦政府部部門宣布,將將投入2億多美元立即即啟動(dòng)“大數(shù)據(jù)發(fā)展展研究計(jì)劃””BigDataResearchandDevelopmentInitiative,以推動(dòng)大數(shù)據(jù)的提取取、存儲(chǔ)、分分析、共享和和可視化。美國(guó)政府推出出了“大數(shù)據(jù)據(jù)”戰(zhàn)略,媲媲美與當(dāng)年克克林頓政府時(shí)時(shí)代的信息高高速公路計(jì)劃劃。奧巴馬希希望借助大數(shù)數(shù)據(jù)來(lái)將美國(guó)國(guó)經(jīng)濟(jì)帶出泥泥潭。從基礎(chǔ)礎(chǔ)建設(shè)、到IT硬件、軟件、、網(wǎng)絡(luò),最后后到數(shù)據(jù)。“與數(shù)俱進(jìn)””:聯(lián)合國(guó)發(fā)發(fā)布大數(shù)據(jù)政政務(wù)白皮書(shū)聯(lián)合國(guó)于2012年7月10日在紐約總部部發(fā)布了一份份大數(shù)據(jù)政務(wù)務(wù)白皮書(shū)《大數(shù)據(jù)促發(fā)展展:挑戰(zhàn)與機(jī)機(jī)遇》,總結(jié)了各國(guó)政政府如何利用用大數(shù)據(jù)更好好地服務(wù)和保保護(hù)人民。大數(shù)據(jù)時(shí)代已已經(jīng)到來(lái)大數(shù)據(jù)對(duì)于聯(lián)聯(lián)合國(guó)和各國(guó)國(guó)政府來(lái)說(shuō)是是一個(gè)歷史性性的機(jī)遇,報(bào)告解釋了大大數(shù)據(jù)如何幫幫助政府更好好地響應(yīng)社會(huì)會(huì)和經(jīng)濟(jì)指標(biāo)標(biāo)變化,例如如收入、失業(yè)業(yè)、食品價(jià)格格等。以愛(ài)爾蘭和美國(guó)國(guó)的社交網(wǎng)絡(luò)絡(luò)活躍度增長(zhǎng)長(zhǎng)可以作為失失業(yè)率上升的的早期征兆為為例,表明政府如果能合合理分析所掌掌握的數(shù)據(jù)資資源,將能““與數(shù)俱進(jìn)””,快速應(yīng)變變。該報(bào)告是聯(lián)合國(guó)國(guó)“全球脈搏搏”項(xiàng)目的產(chǎn)產(chǎn)物?!叭蚯蛎}搏”是聯(lián)聯(lián)合國(guó)發(fā)起的的一個(gè)全新項(xiàng)項(xiàng)目,旨在利利用消費(fèi)互聯(lián)聯(lián)網(wǎng)的數(shù)據(jù)推推動(dòng)全球發(fā)展展。利用自然語(yǔ)言言解碼軟件,,可以對(duì)社交交網(wǎng)絡(luò)和手機(jī)機(jī)短信中的信信息進(jìn)行情緒緒分析,從而而對(duì)失業(yè)率增增加、區(qū)域性性開(kāi)支降低或或疾病暴發(fā)等等進(jìn)行預(yù)測(cè)。建議聯(lián)合國(guó)成員國(guó)國(guó)建設(shè)“脈搏搏實(shí)驗(yàn)室”““PulseLabs””網(wǎng)絡(luò)開(kāi)發(fā)大數(shù)數(shù)據(jù)的潛在價(jià)價(jià)值。駕馭大數(shù)據(jù)能能夠改變什么么?——傳感器、智慧慧地球2011年3月11日日本大地震震發(fā)生后僅9分鐘,美國(guó)國(guó)國(guó)家海洋和大大氣管理局(NOAA)就發(fā)布了詳細(xì)細(xì)的海嘯預(yù)警警。NOAA通過(guò)對(duì)海洋傳傳感器獲得得的實(shí)時(shí)數(shù)數(shù)據(jù)進(jìn)行計(jì)算算機(jī)模擬,制制作的海嘯影影響模型出現(xiàn)現(xiàn)在各大網(wǎng)站站。1962年,經(jīng)過(guò)“圣圣灰星期三””風(fēng)暴后,美美國(guó)陸軍工程程部和美國(guó)國(guó)國(guó)家海洋與大大氣管理局共共同建設(shè)了一一個(gè)傳感器監(jiān)監(jiān)測(cè)系統(tǒng),對(duì)對(duì)興風(fēng)作浪的的海洋進(jìn)行監(jiān)監(jiān)測(cè)。2005年,浮標(biāo)上安安裝了更高端端的傳感器,,用來(lái)監(jiān)測(cè)海海浪方向。2009年,系系統(tǒng)再再次升升級(jí),,開(kāi)始始著手手建立立一個(gè)個(gè)覆蓋蓋全美美海岸岸線的的精確確海浪浪監(jiān)測(cè)測(cè)網(wǎng)絡(luò)絡(luò)。這這些傳傳感器器以分分秒為為單位位,將將數(shù)據(jù)據(jù)源源源不斷斷實(shí)時(shí)時(shí)傳回回。還記得得《后天》里面那那個(gè)場(chǎng)場(chǎng)景??駕馭大大數(shù)據(jù)據(jù)能夠夠改變變什么么?——情感分分析、、輿情情分析析通過(guò)對(duì)對(duì)BBS、博客客、微微博中中內(nèi)容容的分分析,,政府府、企企業(yè)和和個(gè)人人可以以了解解當(dāng)前前輿論論情況況,公公眾對(duì)對(duì)待某某一事事物的的看法法。目目前圍圍繞這這個(gè)產(chǎn)產(chǎn)業(yè),,催生生了一一大撥撥的創(chuàng)創(chuàng)新公公司。。通過(guò)分分析15萬(wàn)條關(guān)關(guān)于劉劉翔的的微博博,分分詞并并析取取出其其中使使用的的字詞詞。在在分析析中,,我們們發(fā)現(xiàn)現(xiàn),為為劉翔翔吶喊喊助威威的聲聲音占占了統(tǒng)統(tǒng)治地地位,,然而而也有有微博博用戶戶激烈烈地批批評(píng)劉劉翔。。這是是我們們第一一次能能對(duì)如如此數(shù)數(shù)量的的中國(guó)國(guó)用戶戶進(jìn)行行數(shù)據(jù)據(jù)可視視化和和情感感分析析在所有有關(guān)于于劉翔翔的微微博中中出現(xiàn)現(xiàn)的最最顯著著的名名詞和和形容容詞。。結(jié)點(diǎn)點(diǎn)越大大表明明越多多人使使用過(guò)過(guò)這個(gè)個(gè)詞。。兩個(gè)個(gè)結(jié)點(diǎn)點(diǎn)離得得越近近表明明它們們一起起出現(xiàn)現(xiàn)在同同一用用戶微微博中中的頻頻率越越高。。我們們?cè)跇?gòu)構(gòu)造出出的這這個(gè)圖圖中,,可以以非常常明顯顯地發(fā)發(fā)現(xiàn)劉劉翔支支持者者所用用的詞詞語(yǔ)((右下下)以以及批批評(píng)者者所有有的詞詞語(yǔ)((左上上)的的巨大大區(qū)別別。駕馭大大數(shù)據(jù)據(jù)能夠夠改變變什么么?——語(yǔ)言、、文字字分析析奧巴馬馬和羅羅姆尼尼辯論論情況況分析析。駕馭大大數(shù)據(jù)據(jù)能夠夠改變變什么么?——社會(huì)化化網(wǎng)絡(luò)絡(luò)分析析分析在在社交交網(wǎng)絡(luò)絡(luò)上談?wù)務(wù)摰牡那闆r況以及及分享享的購(gòu)購(gòu)物情情況,,來(lái)發(fā)發(fā)現(xiàn)失失業(yè)率率變化化情況況和經(jīng)經(jīng)濟(jì)發(fā)發(fā)展?fàn)顮顩r。。駕馭大大數(shù)據(jù)據(jù)能夠夠改變變什么么?——社交網(wǎng)網(wǎng)絡(luò)分分析、、微博營(yíng)銷銷電信行業(yè)、、傳媒媒業(yè)借借助社交網(wǎng)網(wǎng)絡(luò)分分析,,對(duì)客客戶的的通話話數(shù)據(jù)、微博連連接進(jìn)行分析,能夠識(shí)識(shí)別出這部分分“影響者””。社交分析析并不是分析析單一用戶的的通話記錄和微博博信息,而是分析各各用戶所處處的社交網(wǎng)網(wǎng)絡(luò)。圈子識(shí)別關(guān)鍵成員識(shí)識(shí)別傳播影響分分析重入網(wǎng)用戶識(shí)識(shí)別雙機(jī)雙卡用用戶識(shí)別六度空間理理論關(guān)系強(qiáng)度分分析駕馭大數(shù)據(jù)據(jù)能夠改變變什么?——客戶特征與與交叉銷售售以及更多多今年年初,,美國(guó)一名名男子闖入入了他家附附近的Target店鋪(Target是一家美國(guó)國(guó)零售連鎖鎖超市)。?!澳銈?cè)踉趺茨苓@樣樣!”男人人向店鋪經(jīng)經(jīng)理大吼到到,“你們們竟然給我我17歲的女兒發(fā)發(fā)嬰兒尿片片和童車的的優(yōu)惠券,,她才17歲??!”店店鋪經(jīng)理不不知道發(fā)生生了什么,,立刻向來(lái)來(lái)者道歉,,表明那肯肯定是個(gè)誤誤會(huì)。然而而,經(jīng)理沒(méi)沒(méi)有意識(shí)到到,公司正正在運(yùn)行一一套大數(shù)據(jù)據(jù)系統(tǒng)。一一個(gè)月后,,這個(gè)憤怒怒的父親打打來(lái)電話道道歉,因?yàn)闉門arget發(fā)來(lái)的嬰兒兒用品促銷銷廣告并不不是誤發(fā),,他的女兒兒的確懷孕孕了。——《紐約時(shí)報(bào)》報(bào)道更多:反恐(萬(wàn)維信息觸角計(jì)計(jì)劃與建言言計(jì)劃),,庫(kù)存管理理(沃爾瑪?shù)腞etailLink)、賣數(shù)據(jù)據(jù)!大數(shù)據(jù)驅(qū)動(dòng)市市場(chǎng)營(yíng)銷、、驅(qū)動(dòng)成本本控制、驅(qū)驅(qū)動(dòng)產(chǎn)品和和服務(wù)創(chuàng)新新、驅(qū)動(dòng)管管理和決策策的創(chuàng)新、、驅(qū)動(dòng)商業(yè)業(yè)模式的創(chuàng)創(chuàng)新。駕馭大數(shù)據(jù)據(jù)能夠改變變什么?——算法交易、欺詐詐檢測(cè)欺詐檢測(cè):監(jiān)控信用卡使用用,當(dāng)檢測(cè)的信信用卡在很很短的時(shí)間間內(nèi)并且相距甚遠(yuǎn)的的位置已連連續(xù)被使用,檢測(cè)測(cè)到欺詐行為為,拒絕卡的使使用算法交易:及時(shí)發(fā)現(xiàn)現(xiàn)存在的交交易機(jī)會(huì),,每次一小小筆,毫秒秒級(jí)交易,,每天進(jìn)行行數(shù)量眾多多的交易。。已經(jīng)成為為趨勢(shì)金融交易是是最能體現(xiàn)現(xiàn)大數(shù)據(jù)的的Velocity特性的,機(jī)機(jī)會(huì)稍縱即即逝,甚至至券商對(duì)連連接到交易易主機(jī)的網(wǎng)網(wǎng)線長(zhǎng)度都都有至關(guān)重重要的訴求求。算法交交易成為趨趨勢(shì),但也也導(dǎo)致了一一次小型的的股災(zāi)。數(shù)字競(jìng)選團(tuán)團(tuán)隊(duì)我們會(huì)在此此次競(jìng)選活活動(dòng)中對(duì)每每個(gè)事件進(jìn)進(jìn)行數(shù)據(jù)分分析?!眻F(tuán)團(tuán)隊(duì)聘請(qǐng)了了一大批分分析員,人人數(shù)規(guī)模甚甚至達(dá)到了了2008年競(jìng)競(jìng)選選時(shí)時(shí)數(shù)數(shù)據(jù)據(jù)分分析析部部門門的的五五倍倍(據(jù)了了解解大大概概100多人人)整合合信信息息資資源源奧巴巴馬馬競(jìng)競(jìng)選選團(tuán)團(tuán)隊(duì)隊(duì)的的一一位位官官員員表表示示::““我我們們知知道道,,民民主主黨黨的的問(wèn)問(wèn)題題就就在在于于擁?yè)碛杏辛肆舜蟠蠖喽嗟牡臄?shù)數(shù)據(jù)據(jù)庫(kù)庫(kù),,且且沒(méi)沒(méi)有有哪哪兩兩個(gè)個(gè)數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)是是相相同同的的””。。因因此此,,在在總總統(tǒng)統(tǒng)競(jìng)競(jìng)選選前前的的18個(gè)月月,,競(jìng)競(jìng)選選團(tuán)團(tuán)隊(duì)隊(duì)就就創(chuàng)創(chuàng)建建了了一一個(gè)個(gè)龐龐大大系系統(tǒng)統(tǒng),,這這一一系系統(tǒng)統(tǒng)可可以以將將民民調(diào)調(diào)者者、、注注資資者者、、工工作作人人員員、、消消費(fèi)費(fèi)者者、、社社交交媒媒體體以以及及““搖搖擺擺州州””主主要要的的民民主主黨黨投投票票人人的的信信息息進(jìn)進(jìn)行行整整合合。。競(jìng)選選結(jié)結(jié)果果預(yù)預(yù)測(cè)測(cè)奧巴巴馬馬的的數(shù)數(shù)據(jù)據(jù)分分析析團(tuán)團(tuán)隊(duì)隊(duì)此此前前曾曾在在關(guān)關(guān)鍵鍵州州收收集集數(shù)數(shù)據(jù)據(jù),,并并建建立立了了4條投票數(shù)據(jù)流流,用于拼湊湊出當(dāng)?shù)剡x民民的詳細(xì)數(shù)據(jù)據(jù)模型。奧巴巴馬的數(shù)據(jù)分分析團(tuán)隊(duì)可以以更清楚的了了解每類人群群和地區(qū)選民民在任何時(shí)刻刻的投票傾向向。開(kāi)辟第二戰(zhàn)場(chǎng)場(chǎng)奧巴馬競(jìng)選團(tuán)團(tuán)隊(duì)首次利用用Facebook這些社交網(wǎng)絡(luò)絡(luò)進(jìn)行大規(guī)模模的游說(shuō),就就像此前挨家家挨戶敲門拉拉票的方式一一樣。數(shù)據(jù)還還幫助奧巴馬馬競(jìng)選團(tuán)隊(duì)更更好的作出了了廣告購(gòu)買的的決策。在選選擇廣告投放放渠道時(shí),他他們沒(méi)有依靠靠外部顧問(wèn),,而是基于內(nèi)內(nèi)部數(shù)據(jù)得出出結(jié)論。奧巴馬連任的的機(jī)密:“大大數(shù)據(jù)”制勝勝的四大法寶寶目錄河北移移動(dòng)的的機(jī)會(huì)會(huì)應(yīng)對(duì)大大數(shù)據(jù)據(jù)的技技術(shù)2什么是是大數(shù)數(shù)據(jù)??13應(yīng)對(duì)““大數(shù)數(shù)據(jù)””的技技術(shù)世界正正在從從“大大量””的““小數(shù)數(shù)據(jù)””,向向“少少量””的““大數(shù)數(shù)據(jù)””演進(jìn)進(jìn)。原原來(lái)按按通用用需求求所設(shè)設(shè)計(jì)的的產(chǎn)品品越來(lái)來(lái)越不不實(shí)用用,專用化和深度定制成為應(yīng)對(duì)大大數(shù)據(jù)挑戰(zhàn)戰(zhàn)的技術(shù)趨趨勢(shì)。代碼和數(shù)據(jù)據(jù)不分類代碼+文件通用關(guān)系數(shù)據(jù)庫(kù)+應(yīng)用代碼層次型數(shù)據(jù)據(jù)庫(kù)網(wǎng)狀型數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)技術(shù)數(shù)據(jù)處理技技術(shù)OLTP數(shù)據(jù)庫(kù)內(nèi)存數(shù)據(jù)庫(kù)庫(kù)OLAP數(shù)據(jù)庫(kù)MPP數(shù)據(jù)庫(kù)科學(xué)計(jì)算數(shù)數(shù)據(jù)庫(kù)NOSQLHadoop/MR流處理初始期IT系統(tǒng)較少,較較為專業(yè),采采取深度定制制、耦合的方方式,軟硬件件由同一廠商商提供。發(fā)展期IT系統(tǒng)暴增,軟軟件行業(yè)開(kāi)始始形成,通用用數(shù)據(jù)庫(kù)得到到大量應(yīng)用,,提供標(biāo)準(zhǔn)化化和分層。大數(shù)據(jù)期IT系統(tǒng)整合、減減少,但是數(shù)數(shù)據(jù)量和復(fù)雜雜度變大。平平臺(tái)技術(shù)開(kāi)始始重新由通用用變?yōu)閷S?,,并且通過(guò)深深度耦合得到到更高的效率率。OneSizefitsall?根據(jù)我們自身身情況主要關(guān)關(guān)注的四項(xiàng)技技術(shù)沒(méi)有銀彈,大大數(shù)據(jù)時(shí)代也也是如此。就就我們的大數(shù)數(shù)據(jù)需求來(lái)說(shuō)說(shuō),需要主要要關(guān)注四項(xiàng)技技術(shù)/產(chǎn)品品,,它它們們的的主主要要特特點(diǎn)點(diǎn)、、代代表表產(chǎn)產(chǎn)品品和和解解決決的的大大數(shù)數(shù)據(jù)據(jù)問(wèn)問(wèn)題題如如下下::Hadoop:非非結(jié)結(jié)構(gòu)構(gòu)化化或或批批量量簡(jiǎn)簡(jiǎn)單單匯匯總總、、非非實(shí)實(shí)時(shí)時(shí)處處理理、、數(shù)數(shù)據(jù)據(jù)挖挖掘掘MPP數(shù)據(jù)據(jù)庫(kù)庫(kù):結(jié)結(jié)構(gòu)構(gòu)化化、、關(guān)關(guān)聯(lián)聯(lián)性性分分析析、、即即席席分分析析NoSql:結(jié)結(jié)構(gòu)構(gòu)化化或或非非結(jié)結(jié)構(gòu)構(gòu)化化存存儲(chǔ)儲(chǔ)與與實(shí)實(shí)時(shí)時(shí)查查詢?cè)兞魈幪幚砝恚簩?shí)實(shí)時(shí)時(shí)數(shù)數(shù)據(jù)據(jù)處處理理過(guò)過(guò)濾濾,,規(guī)規(guī)則則匹匹配配四種種技技術(shù)術(shù)之之Hadoop/MRHadoop,包包括括HDFS和其其上上的的MR,被被認(rèn)認(rèn)為為是是解解決決大大數(shù)數(shù)據(jù)據(jù)中中必必不不可可少少的的一一項(xiàng)項(xiàng)技技術(shù)術(shù)和和產(chǎn)產(chǎn)品品。。它它能能輕輕易易實(shí)實(shí)現(xiàn)現(xiàn)各各種種批批量量數(shù)數(shù)據(jù)據(jù)處處理理,,而而且且因因?yàn)闉槠淦湓O(shè)設(shè)計(jì)計(jì)的的簡(jiǎn)簡(jiǎn)化化,,能能輕輕易易分分布布到到海海量量的的X86服務(wù)務(wù)器器上上,,2000、3000節(jié)點(diǎn)點(diǎn)的的Hadoop場(chǎng)景景是是較較為為常常見(jiàn)見(jiàn)的的。。優(yōu)點(diǎn)點(diǎn)處理理各各種種結(jié)結(jié)構(gòu)構(gòu)的的數(shù)數(shù)據(jù)據(jù)靈活活的的處處理理方方式式,,通通過(guò)過(guò)Java編寫寫MR框架架易于于擴(kuò)擴(kuò)展展、、伸伸縮縮,,達(dá)達(dá)到到3000節(jié)點(diǎn)點(diǎn)以以上上((因因其其非非對(duì)對(duì)等等節(jié)節(jié)點(diǎn)點(diǎn)模模型型設(shè)設(shè)計(jì)計(jì)))缺點(diǎn)點(diǎn)((對(duì)對(duì)原原生生解解決決方方案案而而言言))對(duì)靈靈活活的的查查詢?cè)兊牡闹еС殖趾秃晚戫憫?yīng)應(yīng)速速度度流水水線線操操作作優(yōu)優(yōu)化化Map和Reduce大量量數(shù)數(shù)據(jù)據(jù)交交換換問(wèn)問(wèn)題題案例例:淘淘寶寶、、支支付付寶寶、、騰騰訊訊產(chǎn)品品::BC-ETL/OC-ETL/SmartMiner儲(chǔ)備備::兩兩期期云云計(jì)計(jì)算算ETL在經(jīng)經(jīng)分分中中應(yīng)應(yīng)用用研研究究,,目目前前在在開(kāi)開(kāi)展展四四省省試試點(diǎn)點(diǎn)四種種技技術(shù)術(shù)之MPPDB2004年以以后后出出現(xiàn)現(xiàn)了了一一些些新新型型的的MPPDB,例例如如GreenPlum、Vertica、AsterData等。。它它們們借借鑒鑒云云計(jì)計(jì)算算的的成成功功,,設(shè)設(shè)計(jì)計(jì)為為部部署署在在低低成成本本的的X86通用用硬硬件件上上,,通通過(guò)過(guò)副副本本的的方方式式保保證證高高可用用。。由由于于其其sharenothing架構(gòu)構(gòu)以以及及SQL接口口均均為為成成熟熟技技術(shù)術(shù),,輕輕易易獲獲得得了了大大量量廠廠商商和和工工具具的的支支持持。。優(yōu)點(diǎn)接口友好,,支持度高高,兼容性性強(qiáng)可以處理復(fù)復(fù)雜的查詢?cè)儾樵冺憫?yīng)時(shí)時(shí)間快缺點(diǎn)(對(duì)原原生解決方方案而言))只能處理結(jié)結(jié)構(gòu)化數(shù)據(jù)據(jù)高并發(fā)查詢和和操作困難難由于其Hash數(shù)據(jù)分布方方式、對(duì)數(shù)數(shù)據(jù)的保存存、并發(fā)等等精妙的設(shè)設(shè)計(jì)方式限限定了可擴(kuò)擴(kuò)展性。通通常沒(méi)有經(jīng)經(jīng)過(guò)專門優(yōu)優(yōu)化的話限限定在100節(jié)點(diǎn)之下。。案例:聯(lián)通、eBay產(chǎn)品:GP/Vertica等儲(chǔ)備:完成成了新型數(shù)數(shù)據(jù)倉(cāng)庫(kù)測(cè)測(cè)試節(jié)點(diǎn)1節(jié)點(diǎn)2節(jié)點(diǎn)3…本節(jié)點(diǎn)存儲(chǔ)儲(chǔ)備份節(jié)點(diǎn)存儲(chǔ)本節(jié)點(diǎn)存儲(chǔ)儲(chǔ)備份節(jié)點(diǎn)存儲(chǔ)本節(jié)點(diǎn)存儲(chǔ)儲(chǔ)備份節(jié)點(diǎn)存儲(chǔ)本節(jié)點(diǎn)存儲(chǔ)儲(chǔ)備份節(jié)點(diǎn)存存儲(chǔ)以太網(wǎng)交換換機(jī)CPUMEMCPUMEMCPUMEMCPUMEM四種技術(shù)之NoSQL隨著互聯(lián)網(wǎng)網(wǎng)web2.0網(wǎng)站的興起起,傳統(tǒng)的的關(guān)系數(shù)據(jù)據(jù)庫(kù)在應(yīng)付付web2.0網(wǎng)站,特別別是超大規(guī)規(guī)模和高并并發(fā)的SNS類型的web2.0純動(dòng)態(tài)網(wǎng)站站已經(jīng)顯得得力不從心心,暴露了了很多難以以克服的問(wèn)問(wèn)題,而非非關(guān)系型的的數(shù)據(jù)庫(kù)則則由于其本本身的特點(diǎn)點(diǎn)得到了非非常迅速的的發(fā)展。優(yōu)點(diǎn)點(diǎn)為少少量量大大并并發(fā)發(fā)數(shù)數(shù)據(jù)據(jù)寫寫入入和和讀讀出出優(yōu)優(yōu)化化數(shù)據(jù)據(jù)模模式式可可以以靈靈活活變變更更可擴(kuò)擴(kuò)展展性性強(qiáng)強(qiáng)缺點(diǎn)點(diǎn)((對(duì)對(duì)原原生生解解決決方方案案而而言言))與應(yīng)應(yīng)用用深深度度耦耦合合,,高高度度定定制制化化,,對(duì)對(duì)應(yīng)應(yīng)用用要要求求較較高高接口口一一般般為為私私有有案例例::亞馬馬遜遜、、LinkedIn產(chǎn)品品::Hbase/MongoDB儲(chǔ)備備::云云詳詳單單查查詢?cè)兊牡脑囋圏c(diǎn)點(diǎn)四種種技技術(shù)術(shù)之Stream其他他技技術(shù)術(shù)在在處處理理時(shí)時(shí)效效性性方方面面都都無(wú)無(wú)法法達(dá)達(dá)到到實(shí)實(shí)時(shí)時(shí)或或準(zhǔn)準(zhǔn)實(shí)實(shí)時(shí)時(shí)的的地地步步,,但但是是在在某某些些場(chǎng)場(chǎng)景景,,比比如如算算法法交交易易、、欺欺詐詐檢檢測(cè)測(cè)、、實(shí)實(shí)時(shí)時(shí)營(yíng)營(yíng)銷銷等等方方面面,,需需要要從從大大量量的的信信息息中中及及時(shí)時(shí)發(fā)發(fā)現(xiàn)現(xiàn)潛潛在在模模式式,,這這種種情情況況下下,,就就要要使使用用流流處處理理的的技技術(shù)術(shù)——Stream。優(yōu)點(diǎn)基本內(nèi)存處理理,速度快可并行,可擴(kuò)擴(kuò)展編程方式靈活活,可以處理理復(fù)雜結(jié)構(gòu)數(shù)數(shù)據(jù)缺點(diǎn)不保證事務(wù)完完整難以處理某些些大數(shù)據(jù)類型型,比如需要要查表之類的的案例:XX銀行產(chǎn)品:Storm/S4儲(chǔ)備:正在開(kāi)開(kāi)展流處理研研究河北移動(dòng)有各各種各樣的““大數(shù)據(jù)”需需求數(shù)據(jù)特征處理特征使用特征1.數(shù)據(jù)單位存儲(chǔ)儲(chǔ)價(jià)值不同高價(jià)值:CRM\BOSS的各類資料數(shù)數(shù)據(jù)、賬單、、清單低價(jià)值:日志志、網(wǎng)頁(yè)中價(jià)值:高價(jià)價(jià)值中長(zhǎng)期數(shù)據(jù)和低價(jià)值值收斂數(shù)據(jù)20%的結(jié)構(gòu)化數(shù)據(jù)據(jù)提供80%的價(jià)值。2.實(shí)時(shí)要求不同同分鐘、小時(shí)、、日、周、月月3.數(shù)據(jù)類型不同同結(jié)構(gòu)化、半結(jié)結(jié)構(gòu)化、非結(jié)結(jié)構(gòu)化1.調(diào)度模式不同同批量任務(wù)、小小批量任務(wù)、、流式處理2.加工特征不同同關(guān)聯(lián)整合處理理匯總,拋棄輸輸入?yún)R總,不拋棄棄輸入關(guān)聯(lián)+匯總更新,不保留留歷史1.使用角色不同同業(yè)務(wù)人員:低低操作能力IT分析師:中操操作能力數(shù)據(jù)科學(xué)家::高技術(shù)能力力2.使用方式不同同消息型:向一一線推送瀏覽型:決策層簡(jiǎn)單處理型::業(yè)務(wù)人員復(fù)雜處理探索索型:分析師師高級(jí)編程型::不直接使用型型:機(jī)器處理Ad-hoc類使用成為趨趨勢(shì)企業(yè)級(jí)數(shù)據(jù)中中心具有典型的大數(shù)據(jù)據(jù)發(fā)展趨勢(shì),,即3V特征(volumn海量、variety多樣、velocity高速處理)。。如何應(yīng)對(duì)經(jīng)經(jīng)分海量數(shù)據(jù)據(jù)處理壓力,,需要分析企業(yè)業(yè)級(jí)數(shù)據(jù)中心心的數(shù)據(jù)特征、使用特特征和處理特征。將上述四種基基礎(chǔ)能力池化化,開(kāi)放提供供給不同的需需求使用不同的需求可可能會(huì)使用不不同的技術(shù),,同一個(gè)需求求也有相近的的幾種方式可可以選擇,而而且這些大數(shù)數(shù)據(jù)技術(shù)都在在不斷的發(fā)展展之中。為了了保持架構(gòu)的的靈活性,應(yīng)應(yīng)該采取云計(jì)計(jì)算的方法,將這些些技術(shù)術(shù)能力力池化化,通過(guò)過(guò)“市市場(chǎng)””這支支看不不見(jiàn)的的手來(lái)來(lái)調(diào)節(jié)節(jié)需求求,做好資資源的的動(dòng)態(tài)態(tài)劃撥撥。企業(yè)數(shù)數(shù)據(jù)中中心SaaSDaaSIaaSRaaSX86資源池池存儲(chǔ)資源池池高性能能硬件資源池池MPP數(shù)據(jù)庫(kù)庫(kù)池Hadoop池NoSQL池(軟件即服務(wù)務(wù))(資源源即服服務(wù)))(數(shù)據(jù)據(jù)即服服務(wù)))(基礎(chǔ)礎(chǔ)設(shè)施施即服服務(wù)))PaaS(平臺(tái)臺(tái)即服服務(wù)))ETL工具……數(shù)據(jù)質(zhì)質(zhì)量管管理元數(shù)據(jù)據(jù)管理理自助分分析工工具自助服務(wù)自助取數(shù)自助分析數(shù)據(jù)導(dǎo)入導(dǎo)出……常規(guī)應(yīng)用集團(tuán)客戶分析終端分析流量分析…..網(wǎng)絡(luò)資源池池流處理理池目錄應(yīng)對(duì)大大數(shù)據(jù)據(jù)的技技術(shù)河北移移動(dòng)的的機(jī)會(huì)會(huì)3什么是是大數(shù)數(shù)據(jù)??12抓住大大數(shù)據(jù)據(jù)機(jī)遇遇,實(shí)實(shí)現(xiàn)信信息運(yùn)運(yùn)營(yíng),,探索索移動(dòng)動(dòng)互聯(lián)聯(lián)網(wǎng)新新盈利利模式式在線統(tǒng)統(tǒng)計(jì)功功能按按模塊塊開(kāi)放放給合合作伙伙伴,,模塊塊包括括:互互聯(lián)網(wǎng)網(wǎng)輿情情分析析、熱熱點(diǎn)業(yè)業(yè)務(wù)分分析、、終端端類型型占比比、移移動(dòng)商商盟商商家排排名、、用戶戶偏好好分析析等等等合作伙伙伴可可在線線訂購(gòu)購(gòu)和開(kāi)開(kāi)通各各個(gè)模模塊如果現(xiàn)現(xiàn)有數(shù)數(shù)據(jù)信信息產(chǎn)產(chǎn)品不不能滿滿足合合作伙伙伴的的需求求,那那么合合作伙伙伴可可在線線提出出幫扶扶申請(qǐng)請(qǐng)幫扶方式有有兩種,一一是定制信信息產(chǎn)品;;二是由輔輔助運(yùn)營(yíng)團(tuán)團(tuán)隊(duì)制定針針對(duì)性解決決方案并線線上交付各種行業(yè)報(bào)報(bào)告都以書(shū)書(shū)店形式進(jìn)進(jìn)行售賣合作伙伴可可以預(yù)覽和和訂購(gòu),但但所有下載載報(bào)告均設(shè)設(shè)置有信息息安全權(quán)限限在線統(tǒng)計(jì)分分析購(gòu)買行業(yè)報(bào)報(bào)告提出專項(xiàng)幫幫扶需求河北移動(dòng)企企業(yè)級(jí)數(shù)據(jù)據(jù)中心首先先實(shí)現(xiàn)對(duì)內(nèi)內(nèi)的服務(wù),,然后應(yīng)當(dāng)當(dāng)對(duì)外開(kāi)放放,像淘寶寶開(kāi)放平臺(tái)臺(tái)那樣吸引引外部開(kāi)發(fā)發(fā)者進(jìn)駐,,在不影響響客戶隱私私的前提下下充分挖掘掘大數(shù)據(jù)價(jià)價(jià)值,發(fā)現(xiàn)現(xiàn)商機(jī),并并將大數(shù)據(jù)據(jù)應(yīng)用推給給那些需要要他們的人人和企業(yè),,比如零售售、交通、、旅游等等等?;ヂ?lián)網(wǎng)業(yè)界界思想借鑒鑒馬云的目標(biāo)標(biāo):未來(lái)將讓整整個(gè)社會(huì)去去分享數(shù)據(jù)據(jù)。我們的目目標(biāo):讓整個(gè)企業(yè)業(yè)分享數(shù)據(jù)據(jù)。需要容納變變化的支撐撐模式,大大數(shù)據(jù)的處處理技術(shù),,孕育和適適應(yīng)業(yè)務(wù)變變化。數(shù)據(jù)時(shí)代:核心不再再是分析數(shù)數(shù)據(jù),而是是分享數(shù)據(jù)據(jù)。數(shù)據(jù)是是越用越值值錢,不像像是一瓶水水,你喝過(guò)過(guò)我不能再再喝。數(shù)據(jù)據(jù)是你用過(guò)過(guò)增值,他他用過(guò)再增增值。信息時(shí)代:基于我比比別人聰明明的基礎(chǔ)上上面的,收收集了很多多數(shù)據(jù),編編好以后給給別人,這這稱之為信信息處理過(guò)過(guò)的。數(shù)據(jù)是相信信別人比我我聰明,你你把原始數(shù)數(shù)據(jù)交給別別人了,讓讓比你聰明明的人去處處理。變化的業(yè)務(wù)務(wù)模式?更大規(guī)模的的數(shù)據(jù)處理理?更復(fù)雜的處處理邏輯?多平臺(tái)數(shù)據(jù)據(jù)融合?自助分析能能力?對(duì)外開(kāi)放與與合作?聯(lián)通的大數(shù)數(shù)據(jù)實(shí)踐互聯(lián)網(wǎng)服務(wù)務(wù)提供商早早就建立了了自己的大大數(shù)據(jù)平臺(tái)臺(tái),比如阿阿里云、騰騰訊云平臺(tái)臺(tái)、新浪云云平臺(tái)。就就連同為電電信運(yùn)營(yíng)商商的中國(guó)聯(lián)聯(lián)通也開(kāi)始始將大數(shù)據(jù)據(jù)平臺(tái)投入入應(yīng)用。Hadoop/NoSQL平臺(tái)(目前前172個(gè)節(jié)點(diǎn))集中采集各各省的上網(wǎng)網(wǎng)日志,提提供智能管管道、網(wǎng)絡(luò)絡(luò)優(yōu)化、客客戶服務(wù)、、用戶分析析、外部監(jiān)監(jiān)管五大應(yīng)應(yīng)用MPPDB平臺(tái)(二期擴(kuò)容至220個(gè)節(jié)點(diǎn))聯(lián)通集中化化經(jīng)分一期期試用了GP搭建分布式式數(shù)據(jù)庫(kù)平平臺(tái),二期期即將進(jìn)行行擴(kuò)容,對(duì)對(duì)B\O\M的三域數(shù)據(jù)據(jù)進(jìn)行統(tǒng)一一加工和分分析呈現(xiàn)電信的大數(shù)數(shù)據(jù)戰(zhàn)略集團(tuán)大數(shù)據(jù)據(jù)規(guī)劃思路路1、基于云資資源池進(jìn)行行建設(shè);2、構(gòu)建主數(shù)數(shù)據(jù)倉(cāng)庫(kù)集集群、深度度分析庫(kù)集集群以及hadoop云平平臺(tái)臺(tái);;3、考考慮慮到到多多廠廠家家數(shù)數(shù)據(jù)據(jù)庫(kù)庫(kù)的的問(wèn)問(wèn)題題,,構(gòu)構(gòu)建建透透明明訪訪問(wèn)問(wèn)層層;;4、數(shù)數(shù)據(jù)據(jù)采采集集處處理理,,未未考考慮慮實(shí)實(shí)時(shí)時(shí)處處理理的的需需求求,,主主要要在在于于其其不不直直接接面面向向生生產(chǎn)產(chǎn)一一線線,,更更多多的的是是數(shù)數(shù)據(jù)據(jù)融融合合分分析析;;5、系系統(tǒng)統(tǒng)管管理理采采用用統(tǒng)統(tǒng)一一的的云云管管維維平平臺(tái)臺(tái);;他省省大大數(shù)數(shù)據(jù)據(jù)規(guī)規(guī)劃劃思思路路廣西決策支持域ASS統(tǒng)一數(shù)據(jù)接入中心統(tǒng)一云化ETL預(yù)處理平臺(tái)能力服務(wù)中心關(guān)系數(shù)據(jù)倉(cāng)庫(kù)分布式數(shù)據(jù)庫(kù)(MPP庫(kù))統(tǒng)一數(shù)據(jù)訪問(wèn)數(shù)據(jù)封裝基礎(chǔ)功能組件應(yīng)用組裝配置對(duì)外服務(wù)支撐分析應(yīng)用中心基礎(chǔ)分析應(yīng)用挖掘分析應(yīng)用自助分析應(yīng)用實(shí)時(shí)分析應(yīng)用數(shù)據(jù)質(zhì)量管理中心實(shí)時(shí)庫(kù)B域數(shù)據(jù)源O域數(shù)據(jù)源M域數(shù)據(jù)源互聯(lián)網(wǎng)數(shù)據(jù)實(shí)時(shí)信令數(shù)據(jù)101111111、增增加加實(shí)實(shí)時(shí)時(shí)庫(kù)庫(kù),,進(jìn)進(jìn)行行實(shí)實(shí)時(shí)時(shí)數(shù)數(shù)據(jù)據(jù)處處理理;;2、保保留留原原來(lái)來(lái)的的關(guān)關(guān)系系型型數(shù)數(shù)據(jù)據(jù)倉(cāng)倉(cāng)庫(kù)庫(kù);;3、構(gòu)構(gòu)建建統(tǒng)統(tǒng)一一的的Hadoop預(yù)處處理理平平臺(tái)臺(tái);

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論