版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第2章
數(shù)據(jù)的圖表描述1第2章數(shù)據(jù)的圖表描述——目錄2.1單個定性變量的數(shù)據(jù)描述2.2單個定量變量的數(shù)據(jù)描述2.3兩個變量數(shù)據(jù)的表格描述2.4兩個變量數(shù)據(jù)的圖形描述2.5數(shù)據(jù)可視化:創(chuàng)建有效圖形22.1單定性變量的數(shù)據(jù)描述定性數(shù)據(jù)是非數(shù)值型的,因此只能對其進(jìn)行分組(類)處理頻數(shù)分布(頻數(shù)、相對頻數(shù)、百分?jǐn)?shù)頻數(shù))條形圖餅形圖3頻數(shù)(frequency):落在某一特定組別中的觀測值個數(shù)相對頻數(shù)(relativefrequency):頻數(shù)除以總觀測值個數(shù)(n)百分?jǐn)?shù)頻數(shù)(percentagefrequency):相對頻數(shù)乘以100%42.1單定性變量的數(shù)據(jù)描述——頻數(shù)百分?jǐn)?shù)頻數(shù)=相對頻數(shù)×100%相對頻數(shù)=頻數(shù)/n2.1單定性變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)52.1單定性變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)62.1單定性變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)72.1單定性變量的數(shù)據(jù)描述——條形圖條形圖(barchart):對已匯總定性數(shù)據(jù)的頻數(shù)分布進(jìn)行直觀描述的一種圖形表示方法。用寬度相同的條形的高度來表示各類別數(shù)據(jù)的頻數(shù)(條形高度與類別頻數(shù)成正比)。繪制條形圖時,各類別可以放在縱軸,也可以放在橫軸。類別放在橫軸的條形圖也可稱為柱形圖(columnchart)。82.1單定性變量的數(shù)據(jù)描述——條形圖9圖2-1
購買手機品牌的條形圖2.1單定性變量的數(shù)據(jù)描述——餅形圖
102.1單定性變量的數(shù)據(jù)描述——餅形圖11圖2-2
購買手機品牌的餅形圖
122.2單個定量變量的數(shù)據(jù)描述——頻數(shù)2.2單定量變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)132.2單定量變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)14
2.2單定量變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)152.2單定量變量的數(shù)據(jù)描述——頻數(shù)分布表(實例)162.2單定量變量的數(shù)據(jù)描述——直方圖直方圖(histogram):用矩形的寬度和高度(即面積)來表示頻數(shù)分布的定量數(shù)據(jù)的圖形描述方法。在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)分布,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖。17圖2-5
考試成績的直方圖2.2單定量變量的數(shù)據(jù)描述——條形圖vs直方圖條形圖用條形的高度(縱置時)表示各類別頻數(shù)的多少,其寬度沒有意義,是固定的。直方圖用矩形的寬度和高度(即面積)來表示頻數(shù)分布,其高度和寬度均有意義。條形圖的條形是分開排列的,而直方圖的矩形是連續(xù)排列的。182.2單定量變量的數(shù)據(jù)描述——累積頻數(shù)19累積頻數(shù)(cumulativefrequency):將各類有序組別的頻數(shù)逐漸累加起來得到的頻數(shù)??捎糜诿枋龆繑?shù)據(jù)或順序數(shù)據(jù)表示小于或等于每一組上組限的數(shù)據(jù)個數(shù)。2.2單定量變量的數(shù)據(jù)描述——累積頻數(shù)202.2單定量變量的數(shù)據(jù)描述——莖葉圖莖葉圖(stem-and-leafplot):用于顯示未分組的原始數(shù)據(jù)的分布,既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息。莖葉圖由“莖”和“葉”兩部分構(gòu)成,以“17”為例:該組數(shù)據(jù)的高位數(shù)值作樹莖“1”,低位數(shù)字作樹葉“7”。212.2單定量變量的數(shù)據(jù)描述——莖葉圖22圖2-6考試成績的莖葉圖2.2單定量變量的數(shù)據(jù)描述——直方圖vs莖葉圖直方圖可以直觀看清數(shù)據(jù)分布的總體趨勢,但是得不到原始的數(shù)據(jù)內(nèi)容。莖葉圖不僅可以看出數(shù)據(jù)的分布,還能保留原始數(shù)據(jù)的信息。制作莖葉圖不需要對數(shù)據(jù)進(jìn)行分組,當(dāng)數(shù)據(jù)量較少時,用莖葉圖更容易觀察數(shù)據(jù)的分布。莖葉圖的數(shù)據(jù)可以隨時添加數(shù)據(jù),方便記錄與表示。莖葉圖和直方圖的應(yīng)用取決于總體中的個體數(shù)。當(dāng)總體中的個體取值較少時,用莖葉圖估計總體的分布;當(dāng)總體中的個體取值較多時,將樣本數(shù)據(jù)恰當(dāng)分組,選擇直方圖。232.3兩個變量數(shù)據(jù)的表格描述——交叉分組表交叉分組表(crosstable),也稱列聯(lián)表(contingencytable):用于分類觀測值的表格描述方法,是觀測數(shù)據(jù)按多個變量分類所列出的頻數(shù)表。交叉分組表提供了兩個變量之間的相互關(guān)系的基本畫面,可以幫助我們發(fā)現(xiàn)它們之間的相互作用。交叉分組表中的兩個變量,可以是定性數(shù)據(jù)或者定量數(shù)據(jù)。242.3兩個變量數(shù)據(jù)的表格描述——交叉分組表252.3兩個變量數(shù)據(jù)的表格描述——辛普森悖論262.3兩個變量數(shù)據(jù)的表格描述——辛普森悖論272.4兩個變量數(shù)據(jù)的圖形描述——散點圖
282.4兩個變量數(shù)據(jù)的圖形描述——散點圖29圖2-10北京市旅游人數(shù)與餐飲業(yè)收入的散點圖2.4兩個變量數(shù)據(jù)的圖形描述——線圖線圖(linechart):變量以時間為序的圖形描述方法。繪圖時,以時間為橫軸,以變量值為縱軸。時間序列數(shù)據(jù)通常以線圖的形式來表示。30圖2-1204-18年北京市旅游人數(shù)的時間序列圖2.4兩個變量數(shù)據(jù)的圖形描述——復(fù)合和結(jié)構(gòu)條形圖復(fù)合條形圖和結(jié)構(gòu)條形圖均是在條形圖的基礎(chǔ)上進(jìn)行的拓展,可以用于顯示和對比多個數(shù)據(jù)變量。復(fù)合條形圖(side-by-sidebarchart):同時顯示已匯總的多個條形圖的一種圖形描述方法。結(jié)構(gòu)條形圖(stackedbar):其每一個長條被分解為不同段,每段顯示該組數(shù)據(jù)的相對頻數(shù)。312.4兩個變量數(shù)據(jù)的圖形描述——復(fù)合和結(jié)構(gòu)條形圖32圖2-13復(fù)合條形圖圖2-14結(jié)構(gòu)條形圖2.4兩個變量數(shù)據(jù)的圖形描述——環(huán)形圖環(huán)形圖(doughnutchart):由兩個及兩個以上大小不一的餅圖疊在一起,挖去中間部分所構(gòu)成的圖形。類似于結(jié)構(gòu)條形圖,環(huán)形圖同樣可以用來描述數(shù)據(jù)總體結(jié)構(gòu)并對不同數(shù)據(jù)系列進(jìn)行直觀對比。環(huán)形圖中,每個樣本用一個環(huán)來表示,樣本中的每組數(shù)據(jù)的相對頻數(shù)(百分?jǐn)?shù)頻數(shù))用環(huán)中的一段表示。332.4兩個變量數(shù)據(jù)的圖形描述——環(huán)形圖34圖2-15環(huán)形圖2.5數(shù)據(jù)可視化——創(chuàng)建有效的圖形創(chuàng)建有效的圖形顯示是科學(xué)也是藝術(shù)。作為單獨的圖形,簡單的永遠(yuǎn)是最好的。標(biāo)題要清晰、簡明。圖形要保持簡潔,能用二維表示時不要用三維。軸有清楚的標(biāo)記,并給出測量的單位。使用顏色區(qū)分類別時,要確保顏色有明顯差異。用圖例來標(biāo)明多種顏色或線型時,要將圖例靠近所表示的數(shù)據(jù)。所設(shè)計的圖形應(yīng)有助于洞察問題的實質(zhì),避免歪曲事實。352.5數(shù)據(jù)可視化——選擇圖表的類型36用于顯示數(shù)據(jù)分布的圖形描述方法:·條形圖展示定性數(shù)據(jù)的頻數(shù)分布和相對頻數(shù)分布·餅形圖展示定性數(shù)據(jù)的相對頻數(shù)分布和百分?jǐn)?shù)頻數(shù)分布·直方圖展示定量數(shù)據(jù)在一個區(qū)間組集合上的頻數(shù)分布·莖葉圖展示定量數(shù)據(jù)的等級順序和分布形態(tài)用于進(jìn)行比較的圖形描述方法:·復(fù)合條形圖展示兩個變量頻數(shù)的比較·結(jié)構(gòu)條形圖比較和展示兩個變量的相對頻數(shù)和百分?jǐn)?shù)頻數(shù)·環(huán)形圖展示兩個數(shù)據(jù)變量的相對頻數(shù)和百分?jǐn)?shù)頻數(shù)用于顯示兩變量數(shù)據(jù)相關(guān)關(guān)系的圖形描述方法:·散點圖展示兩個數(shù)據(jù)變量的相關(guān)關(guān)系·線圖展示數(shù)據(jù)變量隨時間的變化關(guān)系2.5數(shù)據(jù)可視化——工具Echarts:百度開發(fā)的一款不需要編程的可視化圖表生成工具。其特點:可以在網(wǎng)頁端個性化定制可視化圖表;完全開源免費;可以和百度地圖結(jié)合使用;能夠應(yīng)對較大的數(shù)據(jù)量和三維繪圖任務(wù)。HighCharts:國外開放的一款成熟的可視化圖表生成工具。其特點:具有詳細(xì)的使用教程和案例庫;產(chǎn)品穩(wěn)定性較強;對非商業(yè)使用免費。Tableau:一款用于可視分析數(shù)據(jù)的商業(yè)智能工具。其特點:允許數(shù)據(jù)混合和實時協(xié)作;可以在不編程的情況下進(jìn)行數(shù)據(jù)分析,也可以集成R語言或Python對數(shù)據(jù)進(jìn)行分析;學(xué)生用戶可以認(rèn)證信息后免費下載和試用一年,其他用戶也可以下載TableauPublic免費使用,但是需要將自己的數(shù)據(jù)公開到Tableau的服務(wù)器上。372.5數(shù)據(jù)可視化——工具PowerBI:是微軟推出的一款商業(yè)智能工具。其特點:可連接數(shù)百個數(shù)據(jù)源,進(jìn)行數(shù)據(jù)的收集、整理和分析,生成個性化的數(shù)據(jù)儀表板;可以在web和移動設(shè)備上與他人共享;當(dāng)建立好數(shù)據(jù)模型后,可以自動刷新數(shù)據(jù),生成新的圖表,實現(xiàn)數(shù)據(jù)處理的全自動化;操作簡單,不需要編程;個人用戶可以免費使用PowerBIDesktop。FineBI:主要面向企業(yè)客戶,也是一款不需要編程的商業(yè)智能工具。其特點:相比于其他商業(yè)智能工具,F(xiàn)ineBI更加契合企業(yè)分工協(xié)作進(jìn)行數(shù)據(jù)分析的工作流程;操作界面簡單,對普通用戶的使用和上手門檻相對更低;對于個人用戶來說,F(xiàn)ineBI可以免費下載使用。382.5數(shù)據(jù)可視化——數(shù)據(jù)儀表板數(shù)據(jù)儀表板(datadashboard):一個直觀顯示的集合,它用易于理解的方法匯總和展示公司或機構(gòu)的信息,用以監(jiān)控公司業(yè)績。392.5數(shù)據(jù)可視化——數(shù)據(jù)儀表板40為了說明在決策中數(shù)據(jù)儀表板的使用,我們將用某超市2019年4月1日到30日一個月的銷售數(shù)據(jù),做一個銷售分析的數(shù)據(jù)儀表板。首先,我們要明確數(shù)據(jù)儀表板要展示什么內(nèi)容?超市的數(shù)據(jù)儀表板要幫助管理者明確如何選擇更優(yōu)的庫存管理方法,加快庫存周轉(zhuǎn)率,促進(jìn)產(chǎn)品銷售,從而使企業(yè)獲得更多的利潤。針對這個問題,確定以下關(guān)鍵指標(biāo):1.總銷售額、總利潤。2.各品類利潤的比較。3.各品牌利潤、銷售量的比較。4.各品牌有無促銷的銷售量比較。5.各品牌當(dāng)前庫存的庫存量。2.5數(shù)據(jù)可視化——數(shù)據(jù)儀表板41頻數(shù):展示銷售額利潤情況條形圖:各品牌的利潤比較情況餅形圖:各類產(chǎn)品的利潤占比情況條形圖:各品牌當(dāng)前的庫存量條形圖:各品牌的銷售量比較情況復(fù)合條形圖:有無促銷的銷售量比較情況
周銷售額:75028.3
周利潤:32914.3
2.5數(shù)據(jù)可視化——數(shù)據(jù)儀表板42前面討論的數(shù)據(jù)可視化準(zhǔn)則適用于數(shù)據(jù)儀表板的單個圖,也適用于整個儀表板。除了這些準(zhǔn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沈陽理工大學(xué)《激光器件與技術(shù)》2021-2022學(xué)年第一學(xué)期期末試卷
- 食品安全宣傳主題班會
- 沈陽理工大學(xué)《工程爆破》2023-2024學(xué)年第一學(xué)期期末試卷
- 沈陽理工大學(xué)《傳感器與檢測技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 國有企業(yè)買賣合同保證金管理辦法
- 合同備案注銷、更名申請書
- 昆明機場控制區(qū)通行證考試
- 2024-2025年度部編版八年級上冊歷史復(fù)習(xí)訓(xùn)練一
- 2024水泥采購運輸合同
- 深圳矯正牙齒-口腔醫(yī)院
- 2020-2021學(xué)年河南省洛陽市高一上學(xué)期期中考試化學(xué)試題
- 四年級上冊語文第六單元任務(wù)群教學(xué)設(shè)計
- 2024-2025學(xué)年北師大版九年級數(shù)學(xué)上冊期中培優(yōu)試題
- 《高血壓科普知識》課件
- 《建筑工程設(shè)計文件編制深度規(guī)定》(2022年版)
- 心理咨詢中知情同意的倫理困境與解決途徑
- 山地光伏除草施工方案
- 2024-2025學(xué)年蘇教版小學(xué)四年級上學(xué)期期中數(shù)學(xué)試卷及解答參考
- 動物園主題認(rèn)識數(shù)字1-5幼兒教育教學(xué)
- 新疆歷史印記課件
- 2024年西南民族大學(xué)招聘教師歷年高頻500題難、易錯點模擬試題附帶答案詳解
評論
0/150
提交評論