版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、大數(shù)據(jù)論文分析隨著數(shù)據(jù)化時(shí)代的到來(lái),對(duì)于人類如何處理分析數(shù)據(jù)提出了就巨大的疑問(wèn)。在醫(yī)療,經(jīng)濟(jì),通信等一些行業(yè)上已經(jīng)開(kāi)始了比較廣泛的應(yīng)用。2014 巴西世界杯于7 月 14 日凌晨落下帷幕,德國(guó)戰(zhàn)車1:0 戰(zhàn)勝阿根廷,第四次捧起大力神杯。與往屆世界杯不同的是:數(shù)據(jù)分析成為巴西世界杯賽事外的精彩看點(diǎn)。伴隨賽場(chǎng)上球員的奮力角逐,大數(shù)據(jù)也在全力演繹世界杯背后的分析故事。一向以嚴(yán)謹(jǐn)著稱的德國(guó)隊(duì)引入專門處理大數(shù)據(jù)的足球解決方案,進(jìn)行比賽數(shù)據(jù)分析,優(yōu)化球隊(duì)配置,并通過(guò)分析對(duì)手?jǐn)?shù)據(jù)找到比賽的“制敵 ”方式;谷歌、微軟、 Opta 等通過(guò)大數(shù)據(jù)分析預(yù)測(cè)賽果 大數(shù)據(jù),不僅成為賽場(chǎng)上的“第 12 人 ”,也在某種程
2、度上充當(dāng)了世界杯的 預(yù)言帝。大數(shù)據(jù)分析邂逅世界杯,是大數(shù)據(jù)時(shí)代的必然發(fā)生,而大數(shù)據(jù)分析也將在未來(lái)改變我們生活的方方面面。由此可以看出大數(shù)據(jù)分離我們的生活并不遙遠(yuǎn),目前, 大企業(yè)是最早采用大數(shù)據(jù)分析的,往往從個(gè)別部門開(kāi)始使用大數(shù)據(jù)分析工具。我們每一個(gè)人都是數(shù)據(jù)的生產(chǎn)者。在美國(guó), 一些農(nóng)場(chǎng)主他們有 GPS 定位設(shè)備,他們的的農(nóng)業(yè)機(jī)械設(shè)備也提供了大量數(shù)據(jù),通過(guò)對(duì)這些數(shù)據(jù)的分析可以知道土壤肥力和濕度提高農(nóng)業(yè)的生產(chǎn)率。美國(guó)作為當(dāng)今世界上唯一的超級(jí)大國(guó), 他們的大數(shù)據(jù)分析業(yè)務(wù)發(fā)展比中國(guó)早了兩年,許多集群規(guī)模已經(jīng)達(dá)到了上千個(gè)節(jié)點(diǎn),而中國(guó)只有十幾個(gè)。中國(guó)大數(shù)據(jù)分析的案例我最早接觸的是網(wǎng)絡(luò)視頻公司愛(ài)奇藝的應(yīng)用,
3、它們利用互聯(lián)網(wǎng)收集信息的便利,研究客戶在觀看視頻時(shí)播放,暫停,跳過(guò)等功能鍵的使用次數(shù)頻率,從而得知客戶愛(ài)觀看的視頻片段繼而推出了既不影響劇情又沒(méi)有過(guò)多大家不愛(ài)看的章節(jié),一時(shí)間廣受歡迎。但是大數(shù)據(jù)分析在為人們帶來(lái)便利的同時(shí)也存在許多風(fēng)險(xiǎn),相信大家對(duì)于不久前美國(guó)情報(bào)部門人員斯諾登披露的美國(guó)情報(bào)監(jiān)控項(xiàng)目記憶深刻。美國(guó)利用其掌握的大量數(shù)據(jù)信息對(duì)喜多美國(guó)公民進(jìn)行監(jiān)控。而大數(shù)據(jù)分析其信息量巨大,如何保證期被合理利用與保護(hù)依然是分析公司面臨的大問(wèn)題。大數(shù)據(jù)分析的應(yīng)用和發(fā)展前景大數(shù)據(jù) 分析是指對(duì)規(guī)模巨大的數(shù)據(jù)進(jìn)行分析。大數(shù)據(jù)可以概括為4 個(gè) V, 數(shù)據(jù)量大 (Volume) 、速度快(Velocity) 、類
4、型多(Variety) 、真實(shí)性(Veracity) 。大數(shù)據(jù)作為時(shí)下最火熱的IT 行業(yè)的詞匯,隨之而來(lái)的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)安全、數(shù)據(jù)分析、 數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭(zhēng)相追捧大數(shù)據(jù)應(yīng)用與案例分析大數(shù)據(jù)應(yīng)用案例之:醫(yī)療行業(yè)Seton Healthcare 是采用 IBM 最新沃森技術(shù)醫(yī)療保健內(nèi)容分析預(yù)測(cè)的首個(gè)客戶。 該技術(shù)允許企業(yè)找到大量病人相關(guān)的臨床醫(yī)療信息,通過(guò)大數(shù)據(jù)處理,更好地分析病人的信息。在加拿大多倫多的一家醫(yī)院,針對(duì)早產(chǎn)嬰兒,每秒鐘有超過(guò) 3000 次的數(shù)據(jù)讀取。通過(guò)這些數(shù)據(jù)分析,醫(yī)院能夠提前知道哪些早產(chǎn)兒出現(xiàn)問(wèn)題并且有針對(duì)性地采取措施,避免早產(chǎn)嬰兒夭折。它
5、讓更多的創(chuàng)業(yè)者更方便地開(kāi)發(fā)產(chǎn)品,比如通過(guò)社交網(wǎng)絡(luò)來(lái)收集數(shù)據(jù)的健康類 App 。也許未來(lái)數(shù)年后,它們搜集的數(shù)據(jù)能讓醫(yī)生給你的診斷變得更為精確, 比方說(shuō)不是通用的成人每日三次一次一片,而是檢測(cè)到你的血液中藥劑已經(jīng)代謝完成會(huì)自動(dòng)提醒你再次服藥。大數(shù)據(jù)應(yīng)用案例之:能源行業(yè)智能電網(wǎng)現(xiàn)在歐洲已經(jīng)做到了終端,也就是所謂的智能電表。在德國(guó), 為了鼓勵(lì)利用太陽(yáng)能,會(huì)在家庭安裝太陽(yáng)能,除了賣電給你,當(dāng)你的太陽(yáng)能有多余電的時(shí)候還可以買回來(lái)。通過(guò)電網(wǎng)收集每隔五分鐘或十分鐘收集一次數(shù)據(jù),收集來(lái)的這些數(shù)據(jù)可以用來(lái)預(yù)測(cè)客戶的用電習(xí)慣等,從而推斷出在未來(lái)23 個(gè)月時(shí)間里, 整個(gè)電網(wǎng)大概需要多少電。有了這個(gè)預(yù)測(cè)后,就可以向發(fā)電
6、或者供電企業(yè)購(gòu)買一定數(shù)量的電。因?yàn)殡娪悬c(diǎn)像期貨一樣,如果提前買就會(huì)比較便宜,買現(xiàn)貨就比較貴。通過(guò)這個(gè)預(yù)測(cè)后,可以降低采購(gòu)成本。維斯塔斯風(fēng)力系統(tǒng),依靠的是BigInsights 軟件和 IBM 超級(jí)計(jì)算機(jī),然后對(duì)氣象數(shù)據(jù)進(jìn)行分析,找出安裝風(fēng)力渦輪機(jī)和整個(gè)風(fēng)電場(chǎng)最佳的地點(diǎn)。利用大數(shù)據(jù),以往需要數(shù)周的分析工作,現(xiàn)在僅需要不足1 小時(shí)便可完成。大數(shù)據(jù)應(yīng)用案例之:通信行業(yè)XO Communications 通過(guò)使用IBM SPSS 預(yù)測(cè)分析軟件,減少了將近一半的客戶流失率。XO 現(xiàn)在可以預(yù)測(cè)客戶的行為,發(fā)現(xiàn)行為趨勢(shì),并找出存在缺陷的環(huán)節(jié),從而幫助公司及時(shí)采取措施,保留客戶。此外,IBM 新的 Netez
7、za網(wǎng)絡(luò)分析加速器,將通過(guò)提供單個(gè)端到端網(wǎng)絡(luò)、服務(wù)、 客戶分析視圖的可擴(kuò)展平臺(tái),幫助通信企業(yè)制定更科學(xué)、合理決策。電信業(yè)者透過(guò)數(shù)以千萬(wàn)計(jì)的客戶資料,能分析出多種使用者行為和趨勢(shì),賣給需要的企業(yè),這是全新的資料經(jīng)濟(jì)。中國(guó)移動(dòng)通過(guò)大數(shù)據(jù)分析,對(duì)企業(yè)運(yùn)營(yíng)的全業(yè)務(wù)進(jìn)行針對(duì)性的監(jiān)控、預(yù)警、跟蹤。 系統(tǒng)在第一時(shí)間自動(dòng)捕捉市場(chǎng)變化,再以最快捷的方式推送給指定負(fù)責(zé)人,使他在最短時(shí)間內(nèi)獲知市場(chǎng)行情。NTT docomo 把手機(jī)位置信息和互聯(lián)網(wǎng)上的信息結(jié)合起來(lái),為顧客提供附近的餐飲店信息,接近末班車時(shí)間時(shí),提供末班車信息服務(wù)。4、大數(shù)據(jù)應(yīng)用案例之:零售業(yè)“我們的某個(gè)客戶,是一家領(lǐng)先的專業(yè)時(shí)裝零售商,通過(guò)當(dāng)?shù)氐陌儇?/p>
8、商店、公司希望向客戶提供差異化服務(wù),如何定位公司的差異化,他們通過(guò)從Twitter 和 Facebook 上收集社交信息,更深入的理解化妝品的營(yíng)銷模式,隨后他們認(rèn)識(shí)到必須保留兩類有價(jià)值的客戶:高消費(fèi)者和高影響者。希望通過(guò)接受免費(fèi)化妝服務(wù),讓用戶進(jìn)行口碑宣傳,這是交易數(shù)據(jù)與交互數(shù)據(jù)的完美結(jié)合,為業(yè)務(wù)挑戰(zhàn)提供了解決方案?!盜nformatica 的技術(shù)幫助這家零售商用社交平臺(tái)上的數(shù)據(jù)充實(shí)了客戶主數(shù)據(jù),使他的業(yè)務(wù)服務(wù)更具有目標(biāo)性。零售企業(yè)也監(jiān)控客戶的店內(nèi)走動(dòng)情況以及與商品的互動(dòng)。它們將這些數(shù)據(jù)與交易記錄相結(jié)合來(lái)展開(kāi)分析,從而在銷售哪些商品、如何擺放貨品以及何時(shí)調(diào)整售價(jià)上給出意見(jiàn),此類方法已經(jīng)幫助某領(lǐng)
9、先零售企業(yè)減少了17% 的存貨,同時(shí)在保持市場(chǎng)份額的前提下,增加了高利潤(rùn)率自有品牌商品的比例。大數(shù)據(jù)的未來(lái)之路到了 2020 年,人類一年所產(chǎn)生的數(shù)據(jù)將是1000 個(gè)谷歌或10000 個(gè)百度,在數(shù)據(jù)化生存時(shí)代,企業(yè)要做哪些準(zhǔn)備?在大數(shù)據(jù)啟蒙階段,大數(shù)據(jù)時(shí)代作者、牛津大學(xué)教授維克托邁爾舍恩伯格曾應(yīng)邀去多家中國(guó)著名企業(yè)宣講過(guò)大數(shù)據(jù)帶來(lái)的變革;最近一年,各類大數(shù)據(jù)方案企業(yè)也開(kāi)始越來(lái)越多地談?wù)摯髷?shù)據(jù)技術(shù)的實(shí)現(xiàn)。今年夏季,在騰訊舉辦的大數(shù)據(jù)論壇上,騰訊高管與來(lái)自全球最頂尖的學(xué)者熱烈地討論著大數(shù)據(jù)的各種迷思隱私、互聯(lián)互通和數(shù)據(jù)交易。在最近一個(gè)大數(shù)據(jù)的活動(dòng)中,大數(shù)據(jù)開(kāi)源技術(shù)Hadoop 之父 Doug Cu
10、tting 以及大數(shù)據(jù)鏈條上掌握著命脈的“原油型”公司英特爾和Cloudera 的牛人們?cè)俅尉凼住?shù)據(jù)化生存IT 行業(yè)的“指數(shù)效應(yīng)”威力驚人,比如, IT 的基石芯片行業(yè)有個(gè)摩爾定律,每 18 個(gè)月芯片上集成的晶體管數(shù)會(huì)翻番,由此會(huì)帶來(lái)一系列指數(shù)式連鎖反應(yīng) CPU 的性能翻番,芯片的成本折半,功耗也會(huì)折半。這也就是大家為什么看到電子產(chǎn)品快速降價(jià)的根本原因。市場(chǎng)調(diào)研公司IDC 認(rèn)為, 大數(shù)據(jù)行業(yè)也有“摩爾定律”。英特爾中國(guó)研究院院長(zhǎng)吳甘沙非常認(rèn)同這個(gè)說(shuō)法,他曾是英特爾中國(guó)研究院首位 “首席工程師”,主持大數(shù)據(jù)研究。 “如果說(shuō)摩爾定律是我們所在的指數(shù)社會(huì)的基因, 那么大數(shù)據(jù)就是指數(shù)社會(huì)的蛋白質(zhì)?!?/p>
11、吳甘沙說(shuō)。有人說(shuō)大數(shù)據(jù)是新的原材料、新的原油、新的資產(chǎn),甚至是新的貨幣,而吳甘沙認(rèn)為,人類現(xiàn)在的生存就是一場(chǎng)數(shù)據(jù)化生存。人類社會(huì)的各類設(shè)備在不停地感知、傳輸、存儲(chǔ)數(shù)據(jù)。今天,人們認(rèn)為谷歌可能是最大的數(shù)據(jù)擁有者之一,但按照指數(shù)增長(zhǎng)規(guī)律,到2020 年,一年所產(chǎn)生的數(shù)據(jù)將是1000 個(gè)今天的谷歌或10000 個(gè)百度?!拔覀兛吹綌?shù)據(jù)和計(jì)算能力在過(guò)去 15 年間一直呈現(xiàn)指數(shù)級(jí)增長(zhǎng),這種增長(zhǎng)給我們帶來(lái)了根本性變化不能再看單獨(dú)的數(shù)據(jù),而是把全部數(shù)據(jù)放在一起來(lái)考慮,來(lái)描繪出對(duì)人、企業(yè)或是業(yè)務(wù)的高清晰圖像。”大數(shù)據(jù)之父 Doug Cutting說(shuō), “這件事是一個(gè)革命性、階段性的變化?!盌oug Cuttin
12、g 是開(kāi)源技術(shù)世界中一個(gè)很具影響力的人物,他打造了目前在云計(jì)算和大數(shù)據(jù)領(lǐng)域里如日中天的開(kāi)源技術(shù) Hadoop 。他是 Apache 基金會(huì)主席,也是大數(shù)據(jù)平臺(tái)企業(yè)Cloudera的首席技術(shù)官。大量、快速增長(zhǎng)的數(shù)據(jù)需要實(shí)時(shí)儲(chǔ)存、整合和分析,過(guò)去的IT 架構(gòu)已經(jīng)無(wú)法應(yīng)付,這就促成了一種名為Hadoop 開(kāi)源新架構(gòu)的誕生,這是個(gè)可以無(wú)限擴(kuò)容的分布式計(jì)算結(jié)構(gòu)。在這個(gè)無(wú)限擴(kuò)容開(kāi)放式架構(gòu)的發(fā)展大勢(shì)下,IT 業(yè)界才倡導(dǎo)了“軟件定義基礎(chǔ)設(shè)施”的趨勢(shì),把計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)做成開(kāi)放式的標(biāo)準(zhǔn)模塊,降低設(shè)施的門檻;在基礎(chǔ)設(shè)施之上,推動(dòng)開(kāi)放、可信數(shù)據(jù)處理平臺(tái)Hadoop ;在此之上,推動(dòng)整個(gè)生態(tài)圈的創(chuàng)新,實(shí)現(xiàn)各類分析應(yīng)用
13、,把高級(jí)分析功能平民化,使得它能邁入主流市場(chǎng),實(shí)現(xiàn)規(guī)模經(jīng)濟(jì)。數(shù)據(jù)咖啡館騰訊高級(jí)副總裁湯道生曾請(qǐng)教歐洲信息哲學(xué)創(chuàng)始人、牛津大學(xué)教授LucianoFloridi 一個(gè)困擾騰訊大數(shù)據(jù)應(yīng)用的問(wèn)題 數(shù)據(jù)如何互聯(lián)互通,這對(duì)于發(fā)揮數(shù)據(jù)的價(jià)值至關(guān)重要?,F(xiàn)在,數(shù)據(jù)已成為各個(gè)組織的商業(yè)資產(chǎn),數(shù)據(jù)交換成為一個(gè)挑戰(zhàn)。Luciano以人類早先對(duì)石油資源的應(yīng)對(duì)方式進(jìn)行類比:挪威當(dāng)年建立了復(fù)雜的綜合體系去處理自然資源,從而讓整個(gè)人群受益。現(xiàn)在, 政府和手握數(shù)據(jù)的企業(yè)也有責(zé)任去 摸索一個(gè)綜合體系,把數(shù)據(jù)的價(jià)值擴(kuò)大到廣泛的人群。在英特爾,吳甘沙他們也正在開(kāi)展“數(shù)據(jù)安全流通以及定價(jià)”這樣的研究。英特爾有一個(gè)研究平臺(tái),叫做“數(shù)據(jù)咖
14、啡館”,意思是希望這個(gè)平臺(tái)能像咖啡館那樣起到 “匯聚” 作用, 匯聚不同領(lǐng)域、不同企業(yè)的數(shù)據(jù),一起來(lái)產(chǎn)生新的價(jià)值。這里面需要大量的核心技術(shù),例如,頂層的多方安全計(jì)算、數(shù)據(jù)審計(jì)及定價(jià)等。英特爾與美國(guó)癌癥研究機(jī)構(gòu)開(kāi)展合作。癌癥是一個(gè)典型的長(zhǎng)尾病癥。過(guò)去50 年來(lái),癌癥的治愈率僅僅提升了約8% ,這是因?yàn)檠芯繖C(jī)構(gòu)擁有的基因組樣本太少了。如果通過(guò)“數(shù)據(jù)咖啡館”把基因組樣本聚合起來(lái),就能期待癌癥技術(shù)獲得突破。而聚合就需要數(shù)據(jù)交易。某種程度上,目前的數(shù)據(jù)是論斤按兩來(lái)交易的,因?yàn)閿?shù)據(jù)的價(jià)格很難衡量與預(yù)測(cè)。 “在這樣一種數(shù)據(jù)不易定價(jià)的情況下,我們的理念是先用起來(lái),在使用過(guò)程中去發(fā)現(xiàn)它的價(jià)值?!眳歉噬痴f(shuō)。在英特
15、爾宏大的愿景中,希望在2020 年之前,一天之內(nèi)能完成三件事:對(duì)病人進(jìn)行全基因組測(cè)序,鎖定癌癥的相關(guān)基因,形成個(gè)性化的用藥以及修復(fù)方案?,F(xiàn)在癌癥很難治愈的原因是新藥更新速度趕不上癌細(xì)胞的變化速度,有了大數(shù)據(jù)技術(shù),癌癥治愈率將指日可待。數(shù)據(jù)交易只是英特爾在大數(shù)據(jù)研究上的重要方向之一。英特爾的其他重要研究領(lǐng)域還涵蓋兩個(gè)重要領(lǐng)域:數(shù)據(jù)與機(jī)器的關(guān)系什么樣的可擴(kuò)展架構(gòu)能更好地存儲(chǔ)和處理數(shù)據(jù);人和數(shù)據(jù)之間的關(guān)系什么樣的分析工具能增強(qiáng)人的分析能力。以往,在英特爾,1 3 年的事由產(chǎn)品部門來(lái)做,3 5 年的由英特爾研究院來(lái)做,5 8 年的與大學(xué)合作研究。但在這樣一個(gè)不可預(yù)測(cè)的時(shí)代下,英特爾把對(duì) “大數(shù)據(jù)”的研
16、發(fā)周期進(jìn)一步縮短,與大學(xué)合作研究的技術(shù)也希望盡快推向市場(chǎng),像 Spark 、集成了數(shù)據(jù)分析及交換的Datahub ,內(nèi)存數(shù)據(jù)庫(kù)H-Store 、可視化、深度學(xué)習(xí)(Deep learning )等。大數(shù)據(jù)之星今年 3 月, 英特爾以7.4 億美元收購(gòu)了Cloudera18% 的股份, 成為 Cloudera的戰(zhàn)略投資者。一家IT 巨頭的高管評(píng)論說(shuō):“英特爾占領(lǐng)了大數(shù)據(jù)領(lǐng)域的制高點(diǎn)?!盋loudera 是一家在大數(shù)據(jù)領(lǐng)域起著關(guān)鍵作用的創(chuàng)新企業(yè)。它由來(lái)自Facebook 、谷歌、雅虎和甲骨文的高管和工程師在2008 年創(chuàng)建,其商業(yè)模式類似 Linux 領(lǐng)域的開(kāi)源軟件企業(yè)紅帽公司(Red Hat )。
17、Cloudera 中國(guó)專區(qū)開(kāi)源技術(shù)的開(kāi)發(fā)類似今天互聯(lián)網(wǎng)世界的眾籌模式成千上萬(wàn)背景不同的技術(shù)愛(ài)好者聚集在一個(gè)“開(kāi)源社區(qū)”中,一起創(chuàng)造一個(gè)他們熱愛(ài)的軟件技術(shù),人們可以自由使用。在此過(guò)程中,紅帽創(chuàng)造了一種名為“訂閱”的商業(yè)模式,它基于開(kāi)源社區(qū)的軟件,通過(guò)更多測(cè)試和驗(yàn)證,開(kāi)發(fā)出更穩(wěn)定、更易用的 “企業(yè)版”。用戶可以免費(fèi)使用它,但如果需要技術(shù)支持和咨詢服務(wù)就要付費(fèi)。Cloudera 仿照紅帽模式,提供企業(yè)級(jí)Hadoop 平臺(tái)的服務(wù)。如今, Cloudera 已經(jīng)帶頭形成全球最大的大數(shù)據(jù)生態(tài)鏈,有 1200 個(gè)合作伙伴。在美國(guó), 每天 70% 的智能手機(jī)數(shù)據(jù)都是在Cloudera 平臺(tái)上進(jìn)行處理的。 同時(shí)
18、,Cloudera 對(duì)新興大數(shù)據(jù)領(lǐng)域進(jìn)行普及,在全球培訓(xùn)了5 萬(wàn)多名 Hadoop 專家。9 月, Cloudera 落戶中國(guó)。苗凱翔成為其在中國(guó)的第一個(gè)員工,擔(dān)任該公司中國(guó)區(qū)副總裁。之前,他在英特爾負(fù)責(zé)大數(shù)據(jù)業(yè)務(wù),參與了中國(guó)第一個(gè)Hadoop項(xiàng)目2011 年中國(guó)移動(dòng)的通話詳單查詢項(xiàng)目。苗凱翔發(fā)現(xiàn),美國(guó)的大數(shù)據(jù)業(yè)務(wù)發(fā)展要比中國(guó)早兩年,美國(guó)很多集群規(guī)模都已是上千個(gè)節(jié)點(diǎn),中國(guó)才幾十個(gè),他預(yù)計(jì)明年中國(guó)企業(yè)會(huì)部署更大的集群?!爸袊?guó)的企業(yè), 如運(yùn)營(yíng)商、銀行在大數(shù)據(jù)的規(guī)劃上越來(lái)越務(wù)實(shí),設(shè)想也越來(lái)越大。目前他們要先想清楚大數(shù)據(jù)的商業(yè)價(jià)值?!泵鐒P翔說(shuō),“還要考慮清楚用大數(shù)據(jù)的目的是節(jié)省成本,還是創(chuàng)造價(jià)值,這是
19、大數(shù)據(jù)的兩個(gè)主題?!泵鐒P翔用全球最大在線支付公司的實(shí)踐來(lái)說(shuō)明大數(shù)據(jù)的意義。這家企業(yè)本來(lái)用小型機(jī)做數(shù)據(jù)存儲(chǔ),在備份系統(tǒng)建設(shè)中,如果使用同樣的小型機(jī),一套就要上千萬(wàn)美元,太昂貴。最后,它們購(gòu)買了Hadoop 平臺(tái)。 Hadoop 已經(jīng)足夠穩(wěn)定、容量非常龐大,成本只是小型機(jī)的幾十分之一甚至幾百份之一,可以為企業(yè)節(jié)省可觀的成本。這是企業(yè)使用大數(shù)據(jù)技術(shù)的第一步。之后, 這家企業(yè)又基于Hadoop平臺(tái)開(kāi)展新業(yè)務(wù),例如, 給自己的客戶提供各種報(bào)表,僅這項(xiàng)業(yè)務(wù)就為企業(yè)創(chuàng)造Hadoop 非常復(fù)雜,苗凱翔認(rèn)為,Cloudera 的意義是能在中國(guó)把它構(gòu)架起來(lái)、跑起來(lái)。他希望把Cloudera 在金融、電信、零售、制
20、造、政府和醫(yī)療領(lǐng)域的實(shí)踐帶到中國(guó)。伴隨 Cloudera 在中國(guó)落地,其全球性合作伙伴Oracle 、 HP、 DELL、SAS 等會(huì)與 Cloudera 有更多在中國(guó)的合作。同時(shí),它也在找尋本土合作伙伴,像博康智能這樣在一個(gè)細(xì)分市場(chǎng)做得出色的系統(tǒng)集成商。明年第一季度,Cloudera 也會(huì)在中國(guó)開(kāi)展培訓(xùn)業(yè)務(wù)。目前,苗凱翔團(tuán)隊(duì)在與中國(guó)客戶溝通,探討 Cloudera 在中國(guó)的商業(yè)模式。未來(lái)之路近些年, Doug Cutting 一直推進(jìn)Hadoop 在企業(yè)級(jí)市場(chǎng)的實(shí)踐。讓他欣慰的是 Hadoop 在各行業(yè)中開(kāi)展的實(shí)踐。讓他印象最深的是一家信用卡公司。之前,這家企業(yè)檢驗(yàn)欺詐行為需要3 個(gè)月,當(dāng)它采用Hadoop 分析過(guò)往5 年的交易歷史后,發(fā)現(xiàn)了一個(gè)欺詐模式,這個(gè)模式在多年中會(huì)連續(xù)出現(xiàn)。于是,這家信用卡公司采用了Hadoop 技術(shù),不僅節(jié)省了很多成本,效果也非常好。Doug Cutting 也曾拜訪過(guò)一家位于亞特蘭大的兒童醫(yī)院。在醫(yī)院的一間急診室中, 有幾十個(gè)早產(chǎn)兒。嬰兒身上有很多監(jiān)測(cè)器,醫(yī)護(hù)人員可以通過(guò)屏幕來(lái)看這些數(shù)據(jù)。一開(kāi)始,這些數(shù)據(jù)隨時(shí)就被扔掉了。后來(lái),人們把數(shù)據(jù)從那些老式電腦中取出來(lái),存儲(chǔ)起來(lái)并進(jìn)行
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《影片《我們之間的戰(zhàn)爭(zhēng)》翻譯實(shí)踐報(bào)告》
- 《楊樹(shù)染色體加倍技術(shù)研究》
- 2025年度環(huán)保涂料購(gòu)銷與施工合同模板
- 二零二五年度合同管理系統(tǒng)電子化流程再造合同
- 2025年度土方運(yùn)輸合同-綜合交通樞紐建設(shè)服務(wù)
- 2025版數(shù)據(jù)中心能源管理系統(tǒng)總包合同范本3篇
- 二零二五年度商業(yè)演出票務(wù)銷售與推廣合同
- 2025年度城市夜景燈光秀專用照明設(shè)備安裝合同3篇
- 2024年物業(yè)托管開(kāi)發(fā)商協(xié)議
- 國(guó)際學(xué)校新生學(xué)習(xí)協(xié)議書(shū)
- 《四川省病案質(zhì)控指標(biāo)檢查表》填報(bào)指南
- 工程洽商記錄表
- 中式烹調(diào)工藝與實(shí)訓(xùn)(第三版) 課件 第10、11章 烹飪美學(xué)、菜肴創(chuàng)新
- 【旅游學(xué)概論課件】旅游資源
- 1.1、供應(yīng)商管理控制流程與風(fēng)險(xiǎn)控制流程圖
- 初二年級(jí)勞動(dòng)課教案6篇
- 箱變遷移工程施工方案
- 北師大版九年級(jí)數(shù)學(xué)下冊(cè)《圓的對(duì)稱性》評(píng)課稿
- 住宅室內(nèi)裝飾裝修管理辦法課件
- 呼吸系統(tǒng)疾病診療規(guī)范
- 《遙感原理與應(yīng)用》期末考試試卷附答案
評(píng)論
0/150
提交評(píng)論