2023中國大數據發(fā)展分析報告(三)_第1頁
2023中國大數據發(fā)展分析報告(三)_第2頁
2023中國大數據發(fā)展分析報告(三)_第3頁
2023中國大數據發(fā)展分析報告(三)_第4頁
2023中國大數據發(fā)展分析報告(三)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2014中國大數據發(fā)展分析報告(三)

所以,真正的大數據“圈內人”至少要包含以下幾種人:1)業(yè)務運營人員比如互聯(lián)網的產品經理要求技術人員,必須在用戶到達網站的時候就算出他今天的心情指數,而且要實現(xiàn)動態(tài)監(jiān)測,這時候只能用Storm或者Spark來處理了;比如電信運營商要求做到實時營銷,用戶進入營業(yè)廳的時候,必須馬上推送短信給用戶,提示他本營業(yè)廳有一個特別適合他的相親對象(呈現(xiàn)身高、三圍、體重等指標),但是見面前要先購買4G手機;再比如病人來到銀行開戶,銀行了解到用戶最近1周曾經去醫(yī)院門診過兩次,出國旅游過3次,帶孩子游泳兩次,馬上客戶經理就給客戶推薦相關的銀行保險+理財產品。這些業(yè)務人員,往往是驅動技術進步的核心原因。2)架構師架構師有多么重要,當一個業(yè)務人員和一個工程師,一個說著業(yè)務語言,一個說著技術術語在那里討論問題的時候,工程師往往想著用什么樣的代碼能馬上讓他閉嘴,而架構師往往會跳出來說“不,不能那樣,你這樣寫只能解決一個問題并且會制造后續(xù)的若干問題,按照我這個方案來,可以解決后續(xù)的若干問題!”一個非技術企業(yè)的IT系統(tǒng)水平,往往有70%以上的標準掌握在架構設計人員手里,盡快很多優(yōu)秀的架構師都是從工程師慢慢發(fā)展學習而來的,IT架構的重要性,很多企業(yè)都意識到了,這就是很多企業(yè)有CTO和CIO兩個職位,同樣重要!架構之美,當IT系統(tǒng)平穩(wěn)運行的時候沒人能感受到,但是在一個煙囪林立、架構混亂的環(huán)境中走過的人眼中,IT開發(fā)一定要架構現(xiàn)行,開發(fā)在后!3)投資人老板,不用說了,老板給你吃穿,你給老板賣命,天生的基礎資料提供者,老板說要有山便有了山,老板說要做實時數據處理分析,便有了Storm,老板說要做開源,便有了Hadoop,老板還說要做迭代挖掘,便有了Spark……4)科學家他們是別人眼中的Geek,他們是別人眼中的高大上,他們是類似于霍金一樣的神秘的早出晚歸晝伏夜出的眼睛男女,他們是驅動世界技術進步的核心力量。除了世界頂級的IT公司(往往世界技術方向掌握在他們手中),其他公司一般需要1-2個科學家足以,他們是真正投身于科學的人,不要讓他們去考慮業(yè)務場景,不要讓他們去考慮業(yè)務流程,不要讓他們去計算成本,不要讓他們去考慮項目進度,他們唯一需要考慮的就是如何在某個指標上擊敗對手,在某個指標上提高0.1%已經讓他們可以連續(xù)奮戰(zhàn),不眠不休,讓我們都為這些科學家喝彩和歡呼吧。在中國,我認為真正的大數據科學家不超過百人……5)工程師工程師是這樣一群可愛的人,他們年輕,沖動,有理想,又被人尊稱為“屌絲”“鍵盤黨”,他們孜孜不倦的為自己的理想而拼搏,每次自己取得一點點進步的時候,都在考慮是不是地鐵口的雞蛋灌餅又漲了五毛錢。他們敏感,自負,從來不屑于和業(yè)務人員去爭論。工程師和科學家的不同點在于,工程師需要頻繁改動代碼,頻繁測試程序,頻繁上線,但是最后的系統(tǒng)是由若干工程師的代碼組合起來的。每個自負的工程師看到系統(tǒng)的歷史代碼都會鄙視的發(fā)出一聲“哼,這垃圾代碼”,之后便投入到被后人繼續(xù)鄙視的代碼編寫工作中去。6)跟風者他們中有些是培訓師,有些是殺馬特洗剪吹,有些是煤老板有些是失足少女。他們的特點就是炒,和炒房者唯一不同的就是,他們不用付出金錢,他們認為只要和數據沾邊就叫大數據,他們有些人甚至從來沒碰過IT系統(tǒng),他們是渾水摸魚、濫竽充數的高手,他們是被前幾種人鄙視的隱形人。不過我想說,歡迎來炒,一個行業(yè)炒的越兇,真正有價值的人就更能發(fā)揮自己的作用。誤區(qū)二:只有大數據才能拯救世界大數據目前的技術和應用都是在數據分析、數據倉庫等方面,主要針對OLAP(OnlineAnalyticalSystem),從技術角度來說,包含我總結的兩條腿:一條腿是批量數據處理(包括MR、MPP等),另一條腿實時數據流處理(Storm、內存數據庫等)。在此基礎上,部分場景又發(fā)現(xiàn)MR框架或實時框架不能很好的滿足近線、迭代的挖掘需要,故又產生了目前非?;鸬幕趦却鏀祿幚鞸park框架。很多企業(yè)目前的大數據框架是,一方面以Hadoop2.0之上的Hive、Pig框架處理底層的數據加工和處理,把按照業(yè)務邏輯處理完的數據直接送入到應用數據庫中;另一方面以Storm流處理引擎處理實時的數據,根據業(yè)務營銷的規(guī)則觸發(fā)相應的營銷場景。同時,用基于Spark處理技術集群滿足對于實時數據加工、挖掘的需求。以上描述可以看出,大數據說白了就是還沒有進入真正的交易系統(tǒng),沒有在OLTP(OnlineTransactionsystem)方面做出太大的貢獻。至于很多文章把大數據和物聯(lián)網、泛在網、智慧城市都聯(lián)系在一起,我認為大數據不過是條件之一,其余的OLTP系統(tǒng)是否具備,物理網絡甚至組織架構都是重要因素。最后還想說,大數據處理技術,再炫如Google的Dataflow或成熟如Hadoop2.0、數據倉庫、Storm等,本質上都是數據加工工具,對于很多工程師來說,只需要把數據處理流程搞清楚就可以了,在這個平臺上可以用固定的模版和腳本進行數據加工已經足夠。畢竟數據的價值70%以上是對業(yè)務應用而言的,一個炫詞對于業(yè)務如果沒有幫助,終將只是屠龍之術。任何技術、IT架構都要符合業(yè)務規(guī)劃、符合業(yè)務發(fā)展的要求,否則技術只會妨礙業(yè)務和生產力的發(fā)展。隨著時代變遷,大浪淘沙,作為數據行業(yè)的一員,我們每個人都在不同的角色之間轉換,今天你可能是科學家,明天就會變成架構師,今天的工程師也會變成幾年后的科學家,部分人還終將步入跟風者的行列。三、我國大數據發(fā)展的機遇和困境1.大數據迎來大發(fā)展的機遇大數據的快速發(fā)展,使它成為IT領域的又一大新興產業(yè)。據中央財經大學中國經濟管理研究院博士張永力估算,國外大數據行業(yè)約有1000億美元的市場,而且每年都以10%的速度在增長,增速是軟件行業(yè)的兩倍。我國2012年大數據市場規(guī)模大約4.7億元,2013年增速將達到138%,達到11.2億元,產業(yè)發(fā)展?jié)摿Ψ浅>薮蟆?)政府積極介入推動2009年,聯(lián)合國啟動“全球脈動計劃”,借大數據推動落后地區(qū)發(fā)展。2012年1月,世界經濟論壇年會把“大數據、大影響”作為重要議題。美國從開放政府數據、開展關鍵技術研究和推動大數據應用三方面布局大數據產業(yè)。美國在開放政府上非常積極,通過D開放37萬個數據集,并開放網站的API和源代碼,提供上千個數據應用。除了推動本國政府數據開放,美國倡導發(fā)起全球開放政府數據運動,已有41個國家響應。美國政府還投資兩億美元促進大數據核心技術研究和應用,把大數據放在與集成電路、互聯(lián)網同等重要的位臵,從國家層面推進。2)資本市場也對大數據鐘愛有加2012年4月,大數據分析公司Splunk高調宣傳大數據,引發(fā)投資者關注。12月初,為企業(yè)市場提供Hadoop解決方案的創(chuàng)業(yè)公司Cloudera獲得6500萬美元融資,估值約為7億美元。近期,高盛聯(lián)席主席斯科特。斯坦福說:“投資大數據及其運用回報率最高”。大數據領域的企業(yè)并購熱度也在上升,單筆平均并購金額方面,大數據超過云計算位居IT領域榜首,在總并購額上也位居第二。3)人才需求巨大據一家國際咨詢公司,蓋特納咨詢公司預測大數據將為全球帶來440萬個IT新崗位和上千萬個非IT崗位。麥肯錫公司預測美國到2018年需要深度數據分析人才44萬—49萬,缺口14萬—19萬人;需要既熟悉本單位需求又了解大數據技術與應用的管理者150萬,這方面的人才缺口更大。中國是人才大國,但能理解與應用大數據的創(chuàng)新人才更是稀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論