版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1.理解數(shù)據(jù):單純的、沒有任何背景的數(shù)據(jù)是沒有意義的,也容易讓人誤解。數(shù)據(jù)需要有具體的背景才能說明問題。數(shù)據(jù)就像是一種顏色,需要有一個(gè)具體的外觀才能證明它的存在。以紅色為例,它需要一些具體的外觀才能讓我們看到,比如紅色的汽車、紅色的圍巾、紅色的領(lǐng)帶、紅色的鞋子或任何紅色的東西。同理,數(shù)據(jù)也需要和它的環(huán)境、內(nèi)容、模型、方法以及它產(chǎn)生、發(fā)生、使用、修改、執(zhí)行和終止的整個(gè)生命周期結(jié)合在一起。我還沒發(fā)現(xiàn)一個(gè)數(shù)據(jù)科學(xué)家和我談數(shù)據(jù)的時(shí)候不提及像Hadoop、NoSQL、Tableau的技術(shù)或其它老牌供應(yīng)商與流行語。你需要與你的數(shù)據(jù)建立親密的關(guān)系,你需要徹底地了解它。問他人“你的”數(shù)據(jù)為何出現(xiàn)異常就像是問自己的妻子懷了誰的孩子一樣荒謬。我們?cè)谂c聯(lián)合國的合作以及確保學(xué)校遠(yuǎn)離爆炸的相關(guān)軟件中具備一個(gè)獨(dú)有的優(yōu)勢(shì)是:對(duì)底層數(shù)據(jù)的控制力。當(dāng)全世界在使用統(tǒng)計(jì)圖表討論這些數(shù)據(jù)時(shí),我們是那些回家體驗(yàn)數(shù)據(jù)的人,讓它融入我們的日常生活,這些數(shù)據(jù)的價(jià)值、細(xì)節(jié)和增值,是我們不能在其它地方找到的。對(duì)于其它的項(xiàng)目和客戶,我們也是同樣對(duì)待的。2.理解數(shù)據(jù)科學(xué)家:不幸的是,“數(shù)據(jù)科學(xué)家”恰好是數(shù)據(jù)科學(xué)這個(gè)領(lǐng)域中最容易使人困惑和被誤用的詞之一。有人將其聯(lián)想為知曉世間所有事情的神秘預(yù)言家;有人認(rèn)為他們僅僅是統(tǒng)計(jì)學(xué)家;少數(shù)人認(rèn)為他們只是一些熟悉Hadoop和NoSQL的人;還有人認(rèn)為他們就是一些會(huì)做簡單測(cè)試或是在管理會(huì)議中使用很多晦澀難懂的數(shù)學(xué)和統(tǒng)計(jì)學(xué)術(shù)語的人。甚至于,某些人眼中的可視化控制面板,在另一些人看來只是永無止境的ETL(Extract-Transform-Load,數(shù)據(jù)倉庫技術(shù))過程。在我看來,數(shù)據(jù)科學(xué)家是一類比數(shù)據(jù)創(chuàng)造者少一些對(duì)科學(xué)的理解,比數(shù)據(jù)生成者少一點(diǎn)對(duì)數(shù)據(jù)的理解的人,而他們恰恰是知道如何把這兩部分工作融會(huì)貫通的人。一個(gè)好的數(shù)據(jù)科學(xué)家應(yīng)該知道外部有哪些資源可用,應(yīng)該和哪些人聯(lián)系,應(yīng)該雇傭什么樣的人,以及采用什么樣的技術(shù)可以完成工作;可以將商業(yè)目標(biāo)和數(shù)據(jù)集市(datamart)連接起來,可以把每一個(gè)點(diǎn),從商業(yè)利益到人類行為、從數(shù)據(jù)生成到付出的款項(xiàng)簡單地聯(lián)系在一起。3.觀看Ted網(wǎng)站上的這13個(gè)視頻/playlists/56/making_sense_of_too_much_data4.觀看HansRosling的視頻,理解可視化的力量/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen5.收聽PartiallyDerivative的關(guān)于數(shù)據(jù)科學(xué)的每周博客,查看博客中提供的一些有用資源//resources/6.華盛頓大學(xué)的兩個(gè)課程:《數(shù)據(jù)科學(xué)入門》(IntrotoDataScience)和《數(shù)據(jù)分析計(jì)算》(Computingfordataanalysis)會(huì)是個(gè)好開頭7.利用GitHub上的資源,要盡量多讀8.瀏覽MeasureforAmerica網(wǎng)站(/),了解數(shù)據(jù)如何起作用9.閱讀免費(fèi)圖書FieldGuidetoDataSciences(/media/file/The-Field-Guide-to-Data-Science.pdf)10.努力完成“如何成為數(shù)據(jù)科學(xué)家”的信息圖中的每一個(gè)步驟11.閱讀博客“TheDataCamp”(/),提高R編程技術(shù)12.閱讀博客“simplystats”(/),提高統(tǒng)計(jì)分析能力13.閱讀Zipfian學(xué)院網(wǎng)站上一篇非常實(shí)用的文章“APracticalIntrotoDataScience”(/blog/post/46864003608/a-practical-intro-to-data-science)14.試著完成“TheOpenSourceDataScienceMasters”系列課程/15.學(xué)習(xí)Coursera網(wǎng)站創(chuàng)始人之一AndrewNg的機(jī)器學(xué)習(xí)課程/learn/machine-learning16.盡一切努力完成Coursera上的數(shù)據(jù)科學(xué)專項(xiàng)課程(DataScienceSpecialization),完成所有9門課以及核心項(xiàng)目/specializations/jhudatascience17.如果你缺乏計(jì)算機(jī)科學(xué)的背景或是想側(cè)重于數(shù)據(jù)科學(xué)中的編程部分,請(qǐng)完成Coursera上數(shù)據(jù)挖掘?qū)m?xiàng)課程(DataMiningSpecialization)/specializations/datamining18.(可選項(xiàng))根據(jù)你想從事的領(lǐng)域,可以參考下面這些專業(yè)相關(guān)的數(shù)據(jù)科學(xué)課程:醫(yī)療保健分析——入門和專項(xiàng)課程(healthcareanalytics–introandspecialization),教育(education),性能優(yōu)化(performanceoptimization)和一般學(xué)術(shù)研究(generalacademicresearch)/course/bigdataanalytics/specializations/medicaltech/courses/big-data-for-better-performance/big19.如果要了解數(shù)據(jù)科學(xué)應(yīng)用的部署方面,Coursera上的“云計(jì)算”專項(xiàng)課程以及免費(fèi)的AWS(AmazonWebServices)培訓(xùn)則是“必修課”/specializations/cloudcomputing/training/intro_series/20.學(xué)習(xí)“海量數(shù)據(jù)挖掘”(MiningMassiveDatasets)和“過程挖掘”(ProcessMining)這兩門頂尖課程/course/mmds/course/procmin21.27本最好的免費(fèi)數(shù)據(jù)挖掘類書籍/21-free-data-mining-books/22.每天閱讀DataScienceCentral,類似這樣的文章可以讓你在面試中節(jié)約很多時(shí)間。23.盡可能多在Kaggle上參與比賽項(xiàng)目24.如果還想更上一層樓,以下這些Coursera上的統(tǒng)計(jì)課程會(huì)讓你脫穎而出:推論統(tǒng)計(jì)學(xué)(InferentialStatistics),描述統(tǒng)計(jì)學(xué)(DescriptiveStatistics),數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)(DataAnalysisandStatistics),Passiondrivenstats和MakingSenseofData25.關(guān)注預(yù)測(cè)分析領(lǐng)域大牛的Twitter:@mgualtieri,@analyticbridge,@doug_laney,@Hypatia_LeslieA,@hyounpark,@KDnuggets,@anilbatra26.關(guān)注大數(shù)據(jù)和數(shù)據(jù)科學(xué)領(lǐng)域大牛的Twitter:AlistairCroll,AlexPopescu,@rethinkdb,AmyHeineike,AnthonyGoldbloom,BenLorica,@oreillymedia.,BillHewitt,CarlaGentryCSPO,DavidSmith,DavidFeinleib,DerrickHarris,DJPatil,DougLaney-EddDumbill,EricKavanagh,FernHalper,GilPress,GregoryPiatetsky,HilaryMason,JakePorway,JamesGingerich,JamesKobielus,JeffHammerbacher,JeffKelly,JimHarris,JustinLovell,KevinWeil,KrishKrishnan,ManishBhatt,MervAdrian,MichaelDriscoll,MonicaRogati,NeilRaden,PaulPhilp,PeterSkomoroch,Philip(Flip)Kromer,PhilipRussom,PaulZikopoulos,RussellJurney,SidProbstein,StewartTownsend,ToddLipcon,TroySadkowsky,VincentGranville,WilliamMcKnight,YvesMulkers這張表里的全部內(nèi)容需要3-12個(gè)月的時(shí)間完成,但是完全免費(fèi)。并且我保證你掌握這些技能后,工作機(jī)會(huì)就會(huì)滾滾而來。即使你只完成了一半,通知我一聲,我也可以告訴你接下來該怎么辦?,F(xiàn)在就看你的了,無論你在哪里,能負(fù)擔(dān)多少,如果你想擁有超過平均水平至少四倍的收入,這就是你接下來該做的事,至少是接下
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度貨車司機(jī)勞動(dòng)合同與貨運(yùn)車輛維修保養(yǎng)服務(wù)協(xié)議
- 湘教版數(shù)學(xué)八年級(jí)上冊(cè)3.2《立方根》聽評(píng)課記錄2
- 2025年美司那合作協(xié)議書
- 湘教版數(shù)學(xué)九年級(jí)下冊(cè)《3.1 投影》聽評(píng)課記錄4
- 湘教版數(shù)學(xué)九年級(jí)下冊(cè)《2.5.2圓切線》聽評(píng)課記錄2
- 新版華東師大版八年級(jí)數(shù)學(xué)下冊(cè)《17.1變量與函數(shù)》聽評(píng)課記錄16
- 四年級(jí)數(shù)學(xué)上冊(cè)口算題卡
- VR內(nèi)容制作合同模板
- 幼兒園奧運(yùn)會(huì)知識(shí)
- 三年級(jí)數(shù)學(xué)下冊(cè)口算習(xí)題100題
- GB/T 44823-2024綠色礦山評(píng)價(jià)通則
- 人教版英語高考試卷與參考答案(2024年)
- 河砂、碎石生產(chǎn)質(zhì)量保證措施方案
- 三位數(shù)除以兩位數(shù)過關(guān)練習(xí)口算題大全附答案
- 紅樓夢(mèng)服飾文化
- 湖北省2024年村干部定向考試真題
- 2024年沙石材料運(yùn)輸合同
- 浙江省中小學(xué)心理健康教育課程標(biāo)準(zhǔn)
- 老年人能力評(píng)估標(biāo)準(zhǔn)解讀-講義課件
- 醫(yī)保物價(jià)管理培訓(xùn)
- 《共情的力量》課件
評(píng)論
0/150
提交評(píng)論