《大數(shù)據(jù)通識教程》 課件 第13章 數(shù)據(jù)科學與職業(yè)技能_第1頁
《大數(shù)據(jù)通識教程》 課件 第13章 數(shù)據(jù)科學與職業(yè)技能_第2頁
《大數(shù)據(jù)通識教程》 課件 第13章 數(shù)據(jù)科學與職業(yè)技能_第3頁
《大數(shù)據(jù)通識教程》 課件 第13章 數(shù)據(jù)科學與職業(yè)技能_第4頁
《大數(shù)據(jù)通識教程》 課件 第13章 數(shù)據(jù)科學與職業(yè)技能_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數(shù)字文明與數(shù)字治理大數(shù)據(jù)通識教程第13章楊武劍周蘇主編數(shù)據(jù)科學與職業(yè)技能01計算思維02數(shù)據(jù)工程師的社會責任03數(shù)據(jù)科學與職業(yè)技能目錄/CONTENTSPART01計算思維所謂數(shù)據(jù)素養(yǎng),是指具備數(shù)據(jù)意識和數(shù)據(jù)敏感性,能夠有效且恰當?shù)孬@取、分析、處理、利用和展現(xiàn)數(shù)據(jù),它是對統(tǒng)計素養(yǎng)、媒介素養(yǎng)和信息素養(yǎng)的一種延伸和擴展??梢詮奈鍌€方面的維度來思考數(shù)據(jù)素養(yǎng),即對數(shù)據(jù)的敏感性;數(shù)據(jù)的收集能力;數(shù)據(jù)的分析、處理能力;利用數(shù)據(jù)進行決策的能力;對數(shù)據(jù)的批判性思維。13.1計算思維計算思維是運用計算機科學的基礎概念進行問題求解、系統(tǒng)設計、以及人類行為理解等涵蓋計算機科學之廣度的一系列思維活動。13.1.1計算思維的概念為了讓人們更易于理解,可以將計算思維進一步定義為:通過約簡、嵌入、轉化和仿真等方法,把一個看來困難的問題重新闡釋成一個我們知道問題怎樣解決的方法;是一種遞歸思維、并行處理,把代碼譯成數(shù)據(jù)又能把數(shù)據(jù)譯成代碼的方法,是一種多維分析推廣的類型檢查方法;是一種采用抽象和分解來控制龐雜的任務或進行巨大復雜系統(tǒng)設計的方法,是基于關注分離的方法,即在系統(tǒng)中為達到目的而對軟件元素進行劃分與對比,通過適當?shù)年P注分離,將復雜的東西變成可管理的。13.1.1計算思維的概念計算思維也是一種選擇合適的方式去陳述一個問題,或對一個問題的相關方面建模使其易于處理的思維方法;是按照預防、保護及通過冗余、容錯、糾錯的方式,并從最壞情況進行系統(tǒng)恢復的一種思維方法;是利用啟發(fā)式推理尋求解答,也即在不確定情況下的規(guī)劃、學習和調度的思維方法;是利用海量數(shù)據(jù)來加快計算,在時間和空間之間,在處理能力和存儲容量之間進行折衷的思維方法。13.1.1計算思維的概念計算思維吸取了問題解決所采用的一般數(shù)學思維方法,現(xiàn)實世界中巨大復雜系統(tǒng)的設計與評估的一般工程思維方法,以及復雜性、智能、心理、人類行為的理解等的一般科學思維方法。計算思維建立在計算過程的能力和限制之上。計算方法和模型使我們敢于去處理那些原本無法由個人獨立完成的問題求解和系統(tǒng)設計。計算思維直面機器智能的不解之謎:什么人類比計算機做得好?什么計算機比人類做得好?最基本的問題是:什么是可計算的?13.1.1計算思維的概念計算思維最根本的內容,即其本質是抽象和自動化。計算思維中的抽象完全超越物理的時空觀,并完全用符號來表示,其中,數(shù)字抽象只是一類特例。與數(shù)學和物理科學相比,計算思維中的抽象顯得更為豐富,也更為復雜。數(shù)學抽象的最大特點是拋開現(xiàn)實事物的物理、化學和生物學等特性,而僅保留其量的關系和空間的形式,而計算思維中的抽象卻不僅僅如此。13.1.1計算思維的概念計算思維是每個人的基本技能,在培養(yǎng)學生解析能力時,不僅要掌握閱讀、寫作和算術(Reading,wRiting,andaRithmetic——3R),還要學會計算思維。正如印刷出版促進了3R的普及,計算和計算機也以類似的正反饋促進了計算思維的傳播。

圖13-3計算之樹:計算思維教育空間13.1.2計算思維的作用當我們必須求解一個特定問題時,首先會問:解決這個問題有多么困難?怎樣才是最佳的解決方法?計算機科學根據(jù)堅實的理論基礎來準確地回答這些問題。表述問題的難度就是工具的基本能力,必須考慮的因素包括機器的指令系統(tǒng)、資源約束和操作環(huán)境。為了有效地求解一個問題,我們可能要進一步問:一個近似解是否就夠了,是否可以利用一下隨機化,以及是否允許誤報和漏報。計算思維就是通過約簡、嵌入、轉化和仿真等方法,把一個看來困難的問題重新闡釋成一個我們知道怎樣解決的問題。13.1.2計算思維的作用計算思維是一種遞歸思維,它是并行處理,它把代碼譯成數(shù)據(jù)又把數(shù)據(jù)譯成代碼。它是由廣義量綱分析進行的類型檢查。對于別名或賦予人與物多個名字的做法,它既知道其益處又了解其害處。對于間接尋址和程序調用的方法,它既知道其威力又了解其代價。它評價一個程序時,不僅僅根據(jù)其準確性和效率,還有美學的考量,而對于系統(tǒng)的設計,還考慮簡潔和優(yōu)雅。13.1.2計算思維的作用計算思維通過抽象和分解來迎接龐雜的任務或者設計巨大復雜的系統(tǒng)。它是關注的分離,它選擇合適的方式去陳述一個問題,或者是選擇合適的方式對一個問題的相關方面建模使其易于處理。它是利用不變量簡明扼要且表述性地刻畫系統(tǒng)的行為。它使我們在不必理解每一個細節(jié)的情況下就能夠安全地使用、調整和影響一個大型復雜系統(tǒng)的信息。它就是為預期的未來應用而進行的預取和緩存。13.1.2計算思維的作用計算思維是按照預防、保護及通過冗余、容錯、糾錯的方式從最壞情形恢復的一種思維。它稱堵塞為“死鎖”,稱約定為“界面”。計算思維就是學習在同步相互會合時如何避免“競爭條件”(亦稱“競態(tài)條件”)的情形。計算思維利用啟發(fā)式推理來尋求解答,就是在不確定情況下的規(guī)劃、學習和調度。它就是搜索、搜索、再搜索,結果是一系列的網(wǎng)頁,一個贏得游戲的策略,或者一個反例。計算思維利用海量數(shù)據(jù)來加快計算,在時間和空間之間,在處理能力和存儲容量之間進行權衡。13.1.2計算思維的作用計算思維將滲透到我們每個人的生活之中,到那時,諸如算法和前提條件這些詞匯將成為每個人日常語言的一部分,對“非確定論”和“垃圾收集”這些詞的理解會和計算機科學里的含義驅近,而樹已常常被倒過來畫了。我們已經(jīng)見證了計算思維在其他學科中的影響。例如,機器學習改變了統(tǒng)計學。就數(shù)學尺度和維數(shù)而言,統(tǒng)計學習用于各類問題的規(guī)模僅在幾年前還是不可想象的。各種組織的統(tǒng)計部門都聘請了計算機科學家。計算機院系正在與統(tǒng)計學系聯(lián)姻。13.1.2計算思維的作用計算機科學家們對生物科學越來越感興趣,因為他們堅信生物學家能夠從計算思維中獲益。計算機科學對生物學的貢獻決不限于其能夠在海量序列數(shù)據(jù)中搜索尋找模式規(guī)律的本領。最終希望是數(shù)據(jù)結構和算法(我們自身的計算抽象和方法)能夠以其體現(xiàn)自身功能的方式來表示蛋白質的結構。計算生物學正在改變著生物學家的思考方式。類似地,計算博弈理論正改變著經(jīng)濟學家的思考方式,納米計算改變著化學家的思考方式,量子計算改變著物理學家的思考方式。13.1.2計算思維的作用這種思維將成為每個人的技能組合成分,而不僅僅限于科學家。普適計算之于今天就如計算思維之于明天。普適計算是已成為今日現(xiàn)實的昨日之夢,而計算思維就是明日現(xiàn)實。13.1.2計算思維的作用計算思維有以下幾個特點:(1)概念化,不是程序化。計算機科學不是計算機編程。像計算機科學家那樣去思維意味著遠不止能為計算機編程,還要求能夠在抽象的多個層次上思維。許多人將計算機科學等同于計算機編程。許多人為主修計算機科學的學生們看到的只是一個狹窄的就業(yè)范圍。許多人認為計算機科學的基礎研究已經(jīng)完成,剩下的只是工程問題。當我們行動起來去改變這一領域的社會形象時,計算思維就是一個引導著計算機教育家、研究者和實踐者的宏大愿景。13.1.3計算思維的特點(2)根本的,不是刻板的技能。根本技能是每一個人為了在現(xiàn)代社會中發(fā)揮職能所必須掌握的??贪寮寄芤馕吨鴻C械的重復。具有諷刺意味的是,當計算機像人類一樣思考之后,思維可就真的變成機械的了。(3)是人的,不是計算機的思維方式。計算思維是人類求解問題的一條途徑,但決非要使人類像計算機那樣地思考。計算機枯燥且沉悶,人類聰穎且富有想象力。是人類賦予計算機激情。配置了計算設備,我們就能用自己的智慧去解決那些在計算時代之前不敢嘗試的問題,實現(xiàn)“只有想不到,沒有做不到”的境界。13.1.3計算思維的特點(4)數(shù)學和工程思維的互補與融合。計算機科學在本質上源自數(shù)學思維,因為像所有的科學一樣,其形式化基礎建筑于數(shù)學之上。計算機科學又從本質上源自工程思維,因為我們建造的是能夠與實際世界互動的系統(tǒng),基本計算設備的限制迫使計算機學家必須計算性地思考,不能只是數(shù)學性地思考。構建虛擬世界的自由使我們能夠設計超越物理世界的各種系統(tǒng)。13.1.3計算思維的特點(5)是思想,不是人造物。不只是我們生產的軟件硬件等人造物將以物理形式到處呈現(xiàn)并時時刻刻觸及我們的生活,更重要的是還將有我們用以接近和求解問題、管理日常生活、與他人交流和互動的計算概念;而且,面向所有的人,所有地方。當計算思維真正融入人類活動的整體以致不再表現(xiàn)為一種顯式之哲學的時候,它就將成為一種現(xiàn)實。13.1.3計算思維的特點因此,特別需要向人們傳送下面兩個主要信息:(1)智力上的挑戰(zhàn)和引人入勝的科學問題依舊亟待理解和解決。這些問題和解答僅僅受限于我們自己的好奇心和創(chuàng)造力。一個人可以主修英語或者數(shù)學,接著從事各種各樣的職業(yè)。計算機科學也一樣。一個人可以主修計算機科學,接著從事醫(yī)學、法律、商業(yè)、政治,以及任何類型的科學和工程,甚至藝術工作。13.1.3計算思維的特點(2)應該讓“怎么像計算機科學家一樣思維”這樣的課程,面向所有專業(yè),而不僅僅是計算機科學專業(yè)的學生。應當使廣大學生接觸計算的方法和模型,設法激發(fā)公眾對計算機領域科學探索的興趣。應當傳播計算機科學的快樂、崇高和力量,致力于使計算思維成為常識。13.1.3計算思維的特點PART02數(shù)據(jù)工程師的社會責任計算機、網(wǎng)絡、大數(shù)據(jù)和人工智能技術正在使世界經(jīng)歷一場巨大的變革,這種變革不但體現(xiàn)在人們的日常工作和生活中,而且深刻地反映在社會經(jīng)濟、文化等各個方面。比如:網(wǎng)絡信息的膨脹正在逐步瓦解信息集中控制的現(xiàn)狀;與傳統(tǒng)的通信方式相比,計算機通信更有利于不同性別、種族、文化和語言的人們之間的交流,更有助于減少交流中的偏見和誤解。13.2數(shù)據(jù)工程師的社會責任“職業(yè)化”通常也被稱為“職業(yè)特性”、“職業(yè)作風”或“專業(yè)精神”等,應該視為從業(yè)人員、職業(yè)團體及其服務對象——公眾之間的三方關系準則。該準則是從事某一職業(yè),并得以生存和發(fā)展的必要條件。實際上,該準則隱含地為從業(yè)人員、職業(yè)團體(由雇主作為代表)和公眾(或社會)擬訂了一個三方協(xié)議,其中規(guī)定的各方的需求、期望和責任就構成了職業(yè)化的基本內涵。如從業(yè)人員希望職業(yè)團體能夠抵制來自社會的不合理要求,能夠對職業(yè)目標、指導方針和技能要求不斷進行檢查、評價和更新,從而保持該職業(yè)的吸引力。13.2.1職業(yè)化和道德責任反過來,職業(yè)團體也對從業(yè)人員提出了要求,要求從業(yè)人員具有與職業(yè)理想相稱的價值觀念,具有足夠的、完成規(guī)定服務所要求的知識和技能。類似地,社會對職業(yè)團體以及職業(yè)團體對社會都具有一定的期望和需求。任何領域提供的任何一項專業(yè)服務都應該達到三方的滿意,至少能夠使三方彼此接受對方?!奥殬I(yè)化”是一個適用于所有職業(yè)的一個總的原則性協(xié)議,但具體到某一個行業(yè)時,還應考慮其自身特殊的要求。雖然職業(yè)道德規(guī)范沒有法律法規(guī)所具有的強制性,但遵守這些規(guī)范對行業(yè)的健康發(fā)展是至關重要的。13.2.1職業(yè)化和道德責任道德準則被設計來幫助計算機專業(yè)人士決定其有關道德問題的判斷。許多專業(yè)機構(諸如美國計算機協(xié)會、英國計算機協(xié)會、澳大利亞計算機協(xié)會以及美國計算機倫理研究所等)都頒布了道德準則,每種準則在細節(jié)上存在著差別,為專業(yè)人士行為提供了整體指南準則。13.2.1職業(yè)化和道德責任計算機倫理研究所頒布的最短準則如下。(1)不要使用計算機來傷害他人。(2)不要干擾他人的計算機工作。(3)不要監(jiān)控他人的文件。(4)不要使用計算機來偷竊。(5)不要使用計算機來提供假證詞。(6)不要使用或者復制你沒有付費的軟件。13.2.1職業(yè)化和道德責任(7)不要在沒有獲得允許的情況下使用他人的計算機資源。(8)不要盜用他人的智能成果。(9)應該考慮到自己所編寫程序的社會后果。(10)使用計算機時應該體現(xiàn)出對信息的尊重。13.2.1職業(yè)化和道德責任美國計算機協(xié)會(ACM)為專業(yè)人士行為制訂的道德準則包含21條,包括“必須遵守現(xiàn)有的本地、地區(qū)、國家以及國際法律,除非有明確準則要求不必這樣做。”13.2.2ACM職業(yè)道德責任在計算機日益成為各個領域及各項社會事務中心角色的今天,那些直接或間接從事軟件設計和軟件開發(fā)的人員,有著既可從善也可從惡的極大機會,同時還可影響周圍其他從事該職業(yè)的人的行為。為能保證使其盡量發(fā)揮有益的作用,這就必須要求軟件工程師致力于使軟件工程成為一個有益的和受人尊敬的職業(yè)。為此,1998年,IEEE-CS和ACM聯(lián)合特別工作組在對多個計算學科和工程學科規(guī)范進行廣泛研究的基礎上,制訂了軟件工程師職業(yè)化的一個關鍵規(guī)范《軟件工程資格和專業(yè)規(guī)范》。該規(guī)范不代表立法,它只是向實踐者指明社會期望他們達到的標準,以及同行們的共同追求和相互的期望。13.2.2ACM職業(yè)道德責任該規(guī)范要求軟件工程師應該堅持以下8項道德規(guī)范。原則1:公眾。從職業(yè)角色來說,軟件工程師應當始終關注公眾的利益,按照與公眾的安全、健康和幸福相一致的方式發(fā)揮作用。原則2:客戶和雇主。軟件工程師應當有一個認知,什么是其客戶和雇主的最大利益。他們應該總是以職業(yè)的方式擔當他們的客戶或雇主的忠實代理人和委托人。原則3:產品。軟件工程師應當盡可能地確保他們開發(fā)的軟件對于公眾、雇主、客戶以及用戶是有用的,在質量上是可接受的,在時間上要按期完成并且費用合理,同時沒有錯誤。13.2.2ACM職業(yè)道德責任原則4:判斷。軟件工程師應當完全堅持自己獨立自主的專業(yè)判斷并維護其判斷的聲譽。原則5:管理。軟件工程的管理者和領導應當通過規(guī)范的方法贊成和促進軟件管理的發(fā)展與維護,并鼓勵他們所領導的人員履行個人和集體的義務。原則6:職業(yè)。軟件工程師應該提高他們職業(yè)的正直性和聲譽,并與公眾的興趣保持一致。13.2.2ACM職業(yè)道德責任原則7:同事。軟件工程師應該公平合理地對待他們的同事,并應該采取積極的步驟支持社團的活動。原則8:自身。軟件工程師應當在他們的整個職業(yè)生涯中,積極參與有關職業(yè)規(guī)范的學習,努力提高從事自己的職業(yè)所應該具有的能力,以推進職業(yè)規(guī)范的發(fā)展。13.2.2ACM職業(yè)道德責任在軟件開發(fā)的過程中,軟件工程師及工程管理人員不可避免地會在某些與工程相關的事務上產生沖突。軟件工程師應該以符合道德的方式減少和妥善地處理這些沖突。13.2.3軟件工程師道德基礎1996年11月,IEEE道德規(guī)范委員會指定并批準了《工程師基于道德基礎提出異議的指導方針》,提出了9條指導方針:(1)確立清晰的技術基礎:盡量弄清事實,充分理解技術上的不同觀點,而且一旦證實對方的觀點是正確的,就要毫不猶豫地接受。(2)使自己的觀點具有較高的職業(yè)水準,盡量使其客觀和不帶有個人感情色彩,避免涉及無關的事務和感情沖動。(3)及早發(fā)現(xiàn)問題,盡量在最低層的管理部門解決問題。13.2.3軟件工程師道德基礎(4)在因為某事務而決定單干之前,要確保該事務足夠重要,值得為此冒險。(5)利用組織的爭端裁決機制解決問題。(6)保留記錄,收集文件。當認識到自己處境嚴峻的時候,應著手制作日志,記錄自己采取的每一項措施及其時間,并備份重要文件,防止突發(fā)事件。(7)辭職:當在組織內無法化解沖突的時候,要考慮自己是去還是留。選擇辭職既有好處也有缺點,作出決定之前要慎重考慮。13.2.3軟件工程師道德基礎(8)匿名:工程師在認識到組織內部存在嚴重危害,而且公開提請組織的注意可能會招致有關人員超出其限度的強烈反應時,對該問題的反映可以考慮采用匿名報告的形式。(9)外部介入:組織內部化解沖突的努力失敗后,如果工程人員決定讓外界人員或機構介入該事件,那么不管他是否決定辭職,都必須認真考慮讓誰介入??赡艿倪x擇有:執(zhí)法機關、政府官員、立法人員或公共利益組織等。13.2.3軟件工程師道德基礎PART03數(shù)據(jù)科學的職業(yè)技能數(shù)據(jù)科學可以簡單地理解為預測分析和數(shù)據(jù)挖掘,是統(tǒng)計分析和機器學習技術的結合,用于獲取數(shù)據(jù)中的推斷和洞察力。相關方法包括回歸分析、關聯(lián)規(guī)則(比如市場購物車分析)、優(yōu)化技術和仿真(比如蒙特卡羅仿真用于構建場景結果)。數(shù)據(jù)科學的典型技術和數(shù)據(jù)類型包括:(1)優(yōu)化模型、預測模型、預報、統(tǒng)計分析;(2)結構化/非結構化數(shù)據(jù)、多種類型數(shù)據(jù)源、超大數(shù)據(jù)集。13.3數(shù)據(jù)科學的職業(yè)技能商業(yè)智能和數(shù)據(jù)科學都是企業(yè)所需要的,用于應對不斷出現(xiàn)的各種商業(yè)挑戰(zhàn)。商業(yè)智能和數(shù)據(jù)科學有不同的定位和范疇,商業(yè)智能更關注于過去的舊數(shù)據(jù),其結果的商業(yè)價值相對較低;而數(shù)據(jù)科學更著眼于新數(shù)據(jù)和對未來的預測,其商業(yè)價值相對更高。但是,它們并不存在一個明確的劃分,只是各有偏重而己。13.3數(shù)據(jù)科學的職業(yè)技能大數(shù)據(jù)需要數(shù)據(jù)科學,數(shù)據(jù)科學要做到的不僅是存儲和管理,而是預測式的分析(比如如果這樣做,會發(fā)生什么)。數(shù)據(jù)學科是統(tǒng)計學的論證,真正利用到統(tǒng)計學的力量。只有這樣才能夠從數(shù)據(jù)中獲得經(jīng)驗和未來方向的指導。但是,數(shù)據(jù)科學并非簡單的統(tǒng)計學,需要新的應用、新的平臺和新的數(shù)據(jù)觀,而不僅是現(xiàn)有的傳統(tǒng)的基礎架構與軟件平臺。13.3數(shù)據(jù)科學的職業(yè)技能通常,數(shù)據(jù)科學的實踐需要三個一般領域的技能,即:商業(yè)洞察、計算機技術/編程和統(tǒng)計學/數(shù)學。而另一方面,不同的工作對象,他的具體技能集合會有所不同。為探索數(shù)據(jù)科學家應該具有的職業(yè)技能,多個研究項目進行了不同的探索,綜合得出數(shù)據(jù)科學從業(yè)人員相關的25項技能(表13-1)。13.3.1數(shù)據(jù)科學重要技能表13-1數(shù)據(jù)科學中25項技能13.3.1數(shù)據(jù)科學重要技能表13-1列出的25項技能反映了通常與數(shù)據(jù)科學家相關的技能集合。在進行針對數(shù)據(jù)科學家的調查中,調查者要求數(shù)據(jù)專業(yè)人員指出他們在25項不同數(shù)據(jù)科學技能上的熟練程度。研究中,選擇“中等了解”水平作為數(shù)據(jù)專業(yè)人員擁有該技能的標準?!爸械攘私狻闭f明一個數(shù)據(jù)專業(yè)人員能夠按照要求完成任務,并且通常不需要他人的幫助。一項基于620名數(shù)據(jù)專業(yè)人士的研究表明了這樣的數(shù)字:商業(yè)經(jīng)理=250;開發(fā)人員=222;創(chuàng)意人員=221;專業(yè)研究人員=353。13.3.1數(shù)據(jù)科學重要技能以擁有該技能的數(shù)據(jù)專業(yè)人員百分比對表13-1的25項技能進行排序。分析表明,所有數(shù)據(jù)專業(yè)人員中最常見的數(shù)據(jù)科學十大技能是:統(tǒng)計–溝通(87%)

技術–處理結構化數(shù)據(jù)(75%)數(shù)學&建模–數(shù)學(71%)

商業(yè)–項目管理(71%)統(tǒng)計–數(shù)據(jù)挖掘和可視化工具(71%)

統(tǒng)計–科學/科學方法(65%)統(tǒng)計–數(shù)據(jù)管理(65%)

商業(yè)–產品設計和開發(fā)(59%)統(tǒng)計–統(tǒng)計學和統(tǒng)計建模(59%)商業(yè)–商業(yè)開發(fā)(53%)13.3.2常見的數(shù)據(jù)科學十大技能許多重要的數(shù)據(jù)科學技能都屬于統(tǒng)計領域:所有的五項與統(tǒng)計相關的技能都出現(xiàn)在前10項中,包括溝通、數(shù)據(jù)挖掘和可視化工具、科學/科學方法、以及統(tǒng)計學和統(tǒng)計建模;另外,與商業(yè)洞察力相關的三項技能出現(xiàn)在前10,包括項目管理、產品設計以及開發(fā);而沒有編程技能出現(xiàn)在前10中。13.3.2常見的數(shù)據(jù)科學十大技能我們按不同的職業(yè)角色(商業(yè)經(jīng)理、開發(fā)人員、創(chuàng)意人員、研究人員)來看看他們的十大技能。分析中指出了對于每個職業(yè)角色的數(shù)據(jù)專業(yè)人士所擁有每項技能的頻率??梢钥吹剑恍┲匾獢?shù)據(jù)科學技能在不同角色中是通用的。這包括溝通、管理結構化數(shù)據(jù)、數(shù)學、項目管理、數(shù)據(jù)挖掘和可視化工具、數(shù)據(jù)管理、以及產品設計和開發(fā)。然而,除了這些相似之處還有相當大的差異。13.3.3技能因職業(yè)角色而異(1)商業(yè)經(jīng)理:那些認為自己是商業(yè)經(jīng)理(尤其是領導者、商務人士和企業(yè)家)的數(shù)據(jù)專業(yè)人士中的十大數(shù)據(jù)科學技能是:統(tǒng)計–溝通(91%)

商業(yè)–項目管理(86%)商業(yè)–商業(yè)開發(fā)(77%)

技術–處理結構化數(shù)據(jù)(74%)商業(yè)–預算(71%)

商業(yè)–產品設計和開發(fā)(70%)數(shù)學&建模–數(shù)學(65%)

統(tǒng)計–數(shù)據(jù)管理(64%)統(tǒng)計--數(shù)據(jù)挖掘和可視化工具(64%)商業(yè)–管理和兼容性(61%)只與商業(yè)經(jīng)理相關的重要技能毫無疑問的是商業(yè)領域的。這些技能包括商業(yè)開發(fā)、預算、以及管理和兼容性。13.3.3技能因職業(yè)角色而異(2)開發(fā)人員:那些認為自己是開發(fā)工作者(尤其是開發(fā)者和工程師)的數(shù)據(jù)專業(yè)人士中的十大數(shù)據(jù)科學技能是:技術–管理結構化數(shù)據(jù)(91%)

統(tǒng)計–溝通(85%)統(tǒng)計–數(shù)據(jù)挖掘和可視化工具(76%)商業(yè)–產品設計(75%)數(shù)學&建模–數(shù)學(75%)

統(tǒng)計–數(shù)據(jù)管理(75%)商業(yè)–項目管理(74%)

編程–數(shù)據(jù)庫管理(73%)編程–后端編程(70%)

編程–系統(tǒng)管理(65%)13.3.3技能因職業(yè)角色而異只與開發(fā)者相關的技能是技術和編程。這些重要的技能包括后端編程、系統(tǒng)管理以及數(shù)據(jù)庫管理。雖然這些數(shù)據(jù)專業(yè)人員具備這些技能,但是他們中只有少數(shù)人擁有那些在大數(shù)據(jù)世界中很重要的,更加技術化、更加依賴編程的技能。例如,少于一半人掌握云管理(42%),大數(shù)據(jù)和分布式數(shù)據(jù)(48%)和NLP以及文本挖掘(42%)。思考這些百分比是否會隨著更多數(shù)據(jù)科學項目的畢業(yè)生開始就業(yè)而上升。13.3.3技能因職業(yè)角色而異(3)創(chuàng)意人員:那些認為自己是創(chuàng)意工作者(尤其是藝術家和黑客)的數(shù)據(jù)專業(yè)人士中的十大數(shù)據(jù)科學技能是:統(tǒng)計–溝通(87%)

技術–處理結構化數(shù)據(jù)(79%)商業(yè)–項目管理(77%)

統(tǒng)計–數(shù)據(jù)挖掘和可視化工具(77%)數(shù)學&建模–數(shù)學(75%)

商業(yè)–產品設計和開發(fā)(68%)統(tǒng)計–科學/科學方法(68%)

統(tǒng)計–數(shù)據(jù)管理(67%)統(tǒng)計–統(tǒng)計學和統(tǒng)計建模(63%)

商業(yè)–商業(yè)開發(fā)(58%)這里并沒有指針對創(chuàng)意人員的重要技能。事實上,他們的重要數(shù)據(jù)科學技能列表與那些研究者緊密匹配,十項中有八項一致。13.3.3技能因職業(yè)角色而異(4)研究人員:那些認為自己是研究工作者(尤其是研究員、科學家和統(tǒng)計學家)的數(shù)據(jù)專業(yè)人士中的十大數(shù)據(jù)科學技能是:統(tǒng)計–溝通(90%)

統(tǒng)計–數(shù)據(jù)挖掘和可視化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論