帶你走進(jìn)數(shù)據(jù)分析師的世界it學(xué)習(xí)網(wǎng)_第1頁(yè)
帶你走進(jìn)數(shù)據(jù)分析師的世界it學(xué)習(xí)網(wǎng)_第2頁(yè)
帶你走進(jìn)數(shù)據(jù)分析師的世界it學(xué)習(xí)網(wǎng)_第3頁(yè)
帶你走進(jìn)數(shù)據(jù)分析師的世界it學(xué)習(xí)網(wǎng)_第4頁(yè)
帶你走進(jìn)數(shù)據(jù)分析師的世界it學(xué)習(xí)網(wǎng)_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

「本周導(dǎo)讀」我我的作歡迎大家開始數(shù)據(jù)分析學(xué)習(xí)

模式在第一章,為你詳細(xì)介紹有關(guān)數(shù)據(jù)分析師、數(shù)據(jù)分析工作、數(shù)據(jù)分析流程等相關(guān)信息。作為數(shù)據(jù)分析P1的第一章課程,你將學(xué)到如下內(nèi)容:防斷更.眾籌新課 :帶帶你走進(jìn)數(shù)據(jù)分析師的世關(guān)關(guān) 如果同學(xué)認(rèn)為老師語速較慢,建議1.25倍速數(shù)據(jù)分析的定義 模式在本節(jié)中,通過一則歷史上“著名的數(shù)據(jù)分析師”的小故事來了解什么是數(shù)據(jù)分?jǐn)?shù)據(jù)分析的價(jià)值我我的作 模式我們已經(jīng)知道數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來的大量數(shù)據(jù)進(jìn)行分析,提取有用的信息形成結(jié)論并對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。隨著大數(shù)據(jù)時(shí)代的到來,我們收集到的數(shù)據(jù)越來越多,能夠提取的有用信息也越來越多。那么這些信息能夠產(chǎn)生什么樣的價(jià)值呢?防斷更.眾籌新 這一節(jié),分別通過歷史上的、行業(yè)中的以及Capitalone的具體案例來了解,數(shù)據(jù)分析是如何幫助人們做出決策以及數(shù)據(jù)分析是如何推動(dòng)業(yè)務(wù)發(fā)展的。數(shù)據(jù)團(tuán)隊(duì)與數(shù)據(jù)分析師我我的作 模式同樣都需要挖掘數(shù)據(jù)信息,數(shù)據(jù)分析師與數(shù)據(jù)工程師等其他數(shù)據(jù)相關(guān)崗位之間是一種怎么樣的關(guān)系呢?在公司組織架構(gòu)中,數(shù)據(jù)分析師可以隸屬于哪些部門呢?數(shù)據(jù)分析師的匯報(bào)對(duì)象可以哪一層級(jí)的數(shù)據(jù)分析師在企業(yè)中擔(dān)任著非常重要的職責(zé),然而數(shù)據(jù)分析師每天的工作安排是什么樣的?在這一節(jié)中,你可以了解到數(shù)據(jù)團(tuán)隊(duì)與數(shù)據(jù)分析師的相關(guān)信息。我我的作 模式對(duì)于企業(yè)來說,數(shù)據(jù)分析的價(jià)值就在于驅(qū)動(dòng)業(yè)務(wù)發(fā)展。在這一過程中,從某一具體問題出發(fā),這個(gè)問題可能是基于業(yè)務(wù)的需要,也可能是通過某些異常數(shù)據(jù)發(fā)現(xiàn)的。根據(jù)這一具體問題獲取相關(guān)數(shù)據(jù)并通過技術(shù)進(jìn)行數(shù)據(jù)分析,進(jìn)而產(chǎn)出某些業(yè)務(wù)洞見推動(dòng)業(yè)務(wù)的發(fā)展。在這一節(jié)通過某出行平臺(tái)提升的留存率的業(yè)務(wù)實(shí)例帶你了解數(shù)據(jù)分析驅(qū)動(dòng)的業(yè)務(wù)流程。防斷更.眾籌新課:通過《某出行平臺(tái)提升的留存率》案例,希望能夠掌握在數(shù)據(jù)分析是如何驅(qū)動(dòng)業(yè)務(wù)發(fā)數(shù)據(jù)分析師必備硬模式筆記模通過之前的學(xué)習(xí),我們已經(jīng)了解到數(shù)據(jù)分析師的崗位職責(zé)可以概括為運(yùn)用統(tǒng)計(jì)知識(shí)、數(shù)據(jù)管理和商業(yè)模型,制作可視化分析看板,幫助做數(shù)據(jù)驅(qū)動(dòng)的決策等。其主要的工作內(nèi)容可能包括:通過數(shù)據(jù)分析師的崗位職責(zé),我們能夠知道成為一名數(shù)據(jù)分析需要掌握哪些技能。在這一節(jié),讓我們一起了解數(shù)據(jù)分析師必備的硬技能。數(shù)據(jù)分析師必備軟技能我我的作 模式除了使用技術(shù)工具分析數(shù)據(jù)的能力,數(shù)據(jù)分析師還應(yīng)該掌握必要的軟技能。這些軟技能隱藏在工作和生活背后,初級(jí)數(shù)據(jù)分析師在職業(yè)生涯的一開始往往會(huì)對(duì)技術(shù)工具的關(guān)注過多,對(duì)一些軟技能平時(shí)關(guān)注相對(duì)較少,但它卻又非常重要且需要長(zhǎng)期。在這一節(jié)中,你將通過數(shù)據(jù)分析驅(qū)動(dòng)的業(yè)務(wù)流程來了解在這一流程中都需要數(shù)據(jù)分析師具備哪些軟技能。「作業(yè)」量化描述問題我我的作 模式能夠講問題用清晰地量化描述描述出來,這一點(diǎn)在數(shù)據(jù)分析師在定位問題并且解決問題過程中尤為重要。例如,我們?cè)诠ぷ髦袝?huì)經(jīng)常聽到“公司的銷售額太爛了”,這樣的一句描述讓人聽完就會(huì)覺得一頭霧水:公司的業(yè)績(jī)?cè)趺礌€了?有多爛?爛在哪里?但如果我們這樣表述“公司今年業(yè)績(jī)120840萬”,這樣描述問題,就會(huì)描述出銷售額的現(xiàn)狀,進(jìn)而更好的表述問題。通過 案例問題分析》的學(xué)習(xí),了解如何量化描述問題,并完成作業(yè)課間思考作業(yè)在具體描述問題的時(shí)候,可以用基本統(tǒng)計(jì)數(shù)字和對(duì)比的方法,請(qǐng)仿照以下示例量化描述問題。A:公司的銷售額太爛我們可以從時(shí)間、目標(biāo)銷售額、實(shí)際完成值等維度來看銷售額完成情況,所以可以將此問題量化描述為:公司業(yè)績(jī)目標(biāo)為120萬,現(xiàn)在時(shí)間過去8個(gè)月,才完成40萬。A:公司員工的忠誠(chéng)度很我們可以從員工職級(jí)、離職情況、行業(yè)內(nèi)忠誠(chéng)度等維度來看公司的員工忠誠(chéng)度,所以可以將此問題量化描述為:在經(jīng)理級(jí)管理者中,去年一年內(nèi),離職率為30,而行業(yè)內(nèi)平均水平僅為6。今天天氣太冷了(參考維度:氣溫、風(fēng)力等天工作都非常忙(參考維度:工作時(shí)長(zhǎng)、會(huì)議數(shù)量等我現(xiàn)在太胖了(參考維度:時(shí)間、重量等我們的產(chǎn)品價(jià)格太高了(參考維度:行業(yè)內(nèi)均價(jià)等我的回?cái)?shù)據(jù)分析師的能力模型我我的作 模式瑞典統(tǒng)計(jì)學(xué)家(HansRosling):防斷更.眾籌新 數(shù)據(jù)科學(xué)家最重要的技能應(yīng)該是將數(shù)據(jù)轉(zhuǎn)化為非定量的、清晰的、有意義的見解的能力。在數(shù)據(jù)科學(xué)領(lǐng)域中有四種數(shù)據(jù)分析類型:描述性分析,診斷性分析,預(yù)測(cè)性分析和規(guī)范性分析。映射到數(shù)據(jù)分析師的能力上,我們可以將這四種類型的數(shù)據(jù)分析所需能力作為數(shù)據(jù)分析師能力的進(jìn)階。在這一節(jié),你將通過一個(gè)簡(jiǎn)單的小例子理解這四種數(shù)據(jù)分析類型的差異。GartnerGartner分析上升模型英文-你見過的最好的統(tǒng)計(jì)數(shù)據(jù)Gartnerytics-你見過的最好的統(tǒng)計(jì)數(shù)據(jù)"You'veneverseendatapresentedlikethis.Withthedramaandurgencyofasportscaster,statisticsguruHansRoslingdebunksmythsabouttheso-called"develoworld." 搜索標(biāo)題:ThebestSTATSyou’veever 的同學(xué),可以通過瑞典統(tǒng)計(jì)學(xué) 詳細(xì)了解四種數(shù)據(jù)分析類型數(shù)據(jù)分析師的職位晉升我我的作 模式數(shù)據(jù)分析師如何為自己規(guī)劃職業(yè)方向?數(shù)據(jù)分析職位整體上分為兩大類:技術(shù)類和管理類。不同公司對(duì)數(shù)據(jù)分析師的職位劃分稍有不同。在本節(jié),你將了解兩種最典型的職位晉升路線。數(shù)據(jù)的類型我我的作 模式無論是在生活中還是在工作中,數(shù)據(jù)隨處可見。尤其是在工作場(chǎng)景下,數(shù)據(jù)分析師雖然不必像數(shù)據(jù)工程師、數(shù)據(jù)庫(kù)開發(fā)者那樣對(duì)數(shù)據(jù)的、結(jié)構(gòu)以及數(shù)據(jù)倉(cāng)庫(kù)的內(nèi)生技術(shù)一清二楚,但是作為數(shù)據(jù)的挖掘者、分析者和應(yīng)用者,數(shù)據(jù)分析師還是應(yīng)該了解應(yīng)用的數(shù)據(jù)以何種形態(tài)存在、常用數(shù)據(jù)的分布和位置等,以方便分析師為分析快速地準(zhǔn)備素材。防斷更.眾籌新課出我們可以將數(shù)據(jù)定義為三種基本形態(tài):原始數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和分析數(shù)據(jù)。在工作中,數(shù)據(jù)分析師接觸到的數(shù)據(jù)大部分是已經(jīng)經(jīng)過結(jié)構(gòu)化處理過的比較標(biāo)準(zhǔn)的表格數(shù)據(jù)。變量的類型我我的作 模式變量是來源于數(shù)學(xué)的一個(gè)抽象概念,它表示在計(jì)算機(jī)語言中能的計(jì)算結(jié)果或表示具體的值。程序所用到的數(shù)據(jù)都會(huì)保存在內(nèi)存中程序員需要一種機(jī)制來或修改內(nèi)存中的數(shù)據(jù)而這種機(jī)制就是變量。作為計(jì)算機(jī)程序?qū)ふ覂?nèi)存中所存放的數(shù)據(jù)時(shí)的一個(gè),變量可以被賦值,它的作用就是告訴程序,你應(yīng)該去內(nèi)存中的哪個(gè)地方尋找接下來要用到的數(shù)據(jù)。在本節(jié)中,你將具體了解變量的類型。當(dāng)我們?cè)谶x擇分析模型或者做數(shù)據(jù)可視化的時(shí)候,變量的類型會(huì)對(duì)分析師選擇起到非常大的作用。下列變量中是離散型數(shù)值變量的有AABCDE在FGGH防斷更.:IJ對(duì)京東快遞的滿意程度(非常不滿意,比較不滿意,中立,比較滿意,非常滿意K6.1「案例」數(shù)據(jù)分析工作流程我我的作 模式在本周的一節(jié),你將學(xué)個(gè)非常重要的內(nèi)容:數(shù)據(jù)分析工作流程。在之后的學(xué)習(xí)和項(xiàng)目作業(yè)里面,將會(huì)根據(jù)此流程來開展數(shù)據(jù)分析的具體工作。請(qǐng)你重點(diǎn)掌握本節(jié)內(nèi)容,并熟記流程中的具體步驟和每一步驟的工作細(xì)節(jié)。關(guān)于數(shù)據(jù)分析工作流程,不同的研究人員和在職人員都會(huì)基于業(yè)務(wù)的差異以及實(shí)際的工作經(jīng)驗(yàn)作出總結(jié)。在本課程中的數(shù)據(jù)分析工作流程是主講老師基于自己的實(shí)際工作經(jīng)驗(yàn)并且訪談了多位國(guó)內(nèi)外數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師,總結(jié)出的比較合理且通用的數(shù)據(jù)分析流程。在同學(xué)你未來數(shù)據(jù)分析師的工作中可以基于業(yè)務(wù)的實(shí)際情況在此流程的基礎(chǔ)上進(jìn)一步完善。數(shù)數(shù)據(jù)分析工作流數(shù)據(jù)源數(shù)據(jù)源「作業(yè)」數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換我我的作 模式在數(shù)據(jù)分析流程中有兩個(gè)非常重要的步驟:數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)清理處理的是數(shù)據(jù)質(zhì)量上四個(gè)方面的問題:例如數(shù)據(jù)中的數(shù)量為負(fù)值,或者顧客為200歲同一列數(shù)據(jù)或內(nèi)容的格式、單位、命名方式等需要一致。如不同的日期格式:2018313/1/2018;數(shù)據(jù)轉(zhuǎn)換是為分析做最后的數(shù)據(jù)準(zhǔn)備:請(qǐng)同學(xué)認(rèn)真下方,并根據(jù)要求完成本節(jié)作業(yè)課間思考作業(yè)請(qǐng)根據(jù)中的講述回答以下問題【你可以下方表格到Excel清理前清理前63/1/201833/1/201823/1/201843/1/201853/1/201813/1/20187-3/2/20183/2/201893/2/201882018/3/5商品ID/名稱查看表1鹽23456789轉(zhuǎn)換后轉(zhuǎn)換后63/1/201833/1/201823/1/201843/1/201853/1/20181鹽3/1/201873/2/20183/2/201893/2/201883/5/2018我的回關(guān)于數(shù)據(jù)清理的方法在后面的課程中回給大家講到,大家在這一節(jié)中只需要掌握數(shù)據(jù)可能存在的幾種問題就可以了。對(duì)數(shù)據(jù)清理感的同學(xué)可以多搜索一些相關(guān)文章,這里給大家推薦一篇:數(shù)據(jù)的一些梳理。「本周總結(jié)」我我的作 模式在第一章,為你詳細(xì)介紹有關(guān)數(shù)據(jù)分析師、數(shù)據(jù)分析工作、數(shù)據(jù)分析任務(wù)等相關(guān)信息。下圖標(biāo)黃的課程是同學(xué)在本章需要重點(diǎn)掌握的內(nèi)容。在下一周,你將學(xué)習(xí)Excel的基礎(chǔ)操作以及用PowerBI制作數(shù)據(jù)看板。同學(xué)要多多動(dòng)手,勤加練記寫本周的作業(yè)哦,它將有助于你更好的了解數(shù)據(jù)分析「「本門課程的學(xué)」我我的作 模式在正式開始學(xué)習(xí)數(shù)據(jù)分析技術(shù)之前,同學(xué)需要了解本門課程的設(shè)計(jì)邏輯以及本門課程所學(xué)內(nèi)容與數(shù)據(jù)分析流程之間的關(guān)系。本門課程學(xué)習(xí)內(nèi)容vs數(shù)據(jù)分析流程我們可以通過一個(gè)「共享單車公司」數(shù)據(jù)分析項(xiàng)目案例來簡(jiǎn)單了解在接下來七周的時(shí)間你將學(xué)到的知識(shí)模塊及其在數(shù)據(jù)分析項(xiàng)目中的具體應(yīng)用。數(shù)數(shù)據(jù)獲可以用MySQL從「共享單車公司」數(shù)據(jù)庫(kù)中提取數(shù)據(jù),將表格成csv格式以便后續(xù)R、Excel、PowerBI或其他工具進(jìn)行分析;數(shù)數(shù)據(jù)清可以用R或SQL進(jìn)行數(shù)據(jù)缺失值補(bǔ)值等操作,去除調(diào)研數(shù)據(jù)中的缺失值和空值,提升數(shù)據(jù)質(zhì)量便于進(jìn)一步分析;Excel同樣可以進(jìn)行數(shù)據(jù)清理,但是一般應(yīng)用于較小的數(shù)據(jù);數(shù)數(shù)據(jù)轉(zhuǎn)可以用R或SQL進(jìn)行變量判斷、創(chuàng)建新的特征列等操作,合并需要分析的表格,為進(jìn)一步分析與建模準(zhǔn)備數(shù)據(jù);Excel同樣可以進(jìn)行數(shù)據(jù)清理,但是一般應(yīng)用于較小的數(shù)據(jù);數(shù)數(shù)據(jù)探R、Excel、SQLRExcel進(jìn)行數(shù)據(jù)可視化來分析變量的分布和關(guān)系,同時(shí)可以通過機(jī)器學(xué)習(xí)模型來挖掘數(shù)據(jù)中隱含的關(guān)系;統(tǒng)統(tǒng)計(jì)分析與建??梢曰诮y(tǒng)計(jì)理論和機(jī)器學(xué)習(xí)理論完成數(shù)據(jù)分析產(chǎn)出分析結(jié)果我們可以使用統(tǒng)計(jì)理論中的基本統(tǒng)計(jì)量來描述數(shù)據(jù)、設(shè)計(jì)A/B測(cè)試等實(shí)驗(yàn)來推斷數(shù)據(jù)結(jié)論等可以使用機(jī)器學(xué)習(xí)中的決策樹、線性回歸、聚類等模型得出分析結(jié)論分分析呈基于上述步驟的分析結(jié)論,使用PowerBI、Excel和R的可視化呈現(xiàn)分析結(jié)論數(shù)據(jù)分析師的日常工作都包含在數(shù)據(jù)分析流程中,在每一步驟分析師需要視具體工作情況選取不同的分析工具完成。不同分析工具之間各有優(yōu)缺點(diǎn),具體工作和工具之間的匹配性可以參考表格中的描述。同時(shí),數(shù)據(jù)分析師也需要根據(jù)業(yè)務(wù)的需要以及個(gè)人的習(xí)慣進(jìn)行選擇適合的方式。「作業(yè)一」描述性統(tǒng)計(jì)分我我的作 模式描述性統(tǒng)計(jì)分析是指對(duì)總體所有變量有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述主要包括數(shù)據(jù)的集中趨勢(shì)分析、離散程度分析、數(shù)據(jù)的分布特征等。請(qǐng)同學(xué)認(rèn)真下方,并根據(jù)要求完成「作業(yè)一」描述性統(tǒng)計(jì)分析課間思考作業(yè)「三節(jié)課」HR部門月末做了一次員工滿意分?jǐn)?shù),HR姐現(xiàn)將滿意分?jǐn)?shù)結(jié)果發(fā)給了數(shù)據(jù)分析師小A并希望小A能夠通過數(shù)據(jù)分析幫助HR姐呈現(xiàn)本次的結(jié)果。小A將數(shù)據(jù)進(jìn)行整理之后如下表所示?!灸憧梢韵路奖砀竦紼xcel「三節(jié)課」員工滿意分?jǐn)?shù)男男男女男女男男男女女女男男男女男女女男男女男女女女女在學(xué)習(xí)描述性統(tǒng)計(jì)分析之后,小A覺得可以使用一些基本統(tǒng)計(jì)量和簡(jiǎn)單的圖表來呈現(xiàn)本次第一步,小A計(jì)算了【】相關(guān)的量,請(qǐng)你根據(jù)下表中的信息寫出你得到的結(jié)論第二步,小A計(jì)算了【

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論