版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Excel數(shù)據(jù)整理與分析之描述統(tǒng)計(jì)介紹課件匯報(bào)人:AA2024-01-252023AAREPORTING描述統(tǒng)計(jì)基本概念與意義數(shù)據(jù)收集與整理方法數(shù)值型數(shù)據(jù)描述統(tǒng)計(jì)指標(biāo)類別型數(shù)據(jù)描述統(tǒng)計(jì)指標(biāo)圖表展示技巧在描述統(tǒng)計(jì)中應(yīng)用案例實(shí)戰(zhàn):Excel在描述統(tǒng)計(jì)中應(yīng)用目錄CATALOGUE2023PART01描述統(tǒng)計(jì)基本概念與意義2023REPORTING描述統(tǒng)計(jì)定義描述統(tǒng)計(jì)是研究數(shù)據(jù)搜集、整理和描述的統(tǒng)計(jì)學(xué)方法,其內(nèi)容包括如何取得研究所需要的數(shù)據(jù),如何用圖表形式對(duì)數(shù)據(jù)進(jìn)行處理和展示,如何通過對(duì)數(shù)據(jù)的綜合、概括與分析,得出表示數(shù)據(jù)特征的統(tǒng)計(jì)指標(biāo)。描述統(tǒng)計(jì)作用描述統(tǒng)計(jì)在數(shù)據(jù)分析中發(fā)揮著重要作用,它可以幫助我們了解數(shù)據(jù)的基本情況,發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律和趨勢(shì),為后續(xù)的推斷統(tǒng)計(jì)和決策分析提供基礎(chǔ)。描述統(tǒng)計(jì)定義及作用
數(shù)據(jù)類型與特點(diǎn)定量數(shù)據(jù)定量數(shù)據(jù)是數(shù)值型數(shù)據(jù),如身高、體重等,具有可加性、可比性和可測(cè)量性。定量數(shù)據(jù)可以進(jìn)行各種數(shù)學(xué)運(yùn)算和統(tǒng)計(jì)分析。定性數(shù)據(jù)定性數(shù)據(jù)是描述性的、非數(shù)值型的數(shù)據(jù),如性別、職業(yè)等。定性數(shù)據(jù)通常通過分類、編碼和匯總等方式進(jìn)行處理和分析。時(shí)間序列數(shù)據(jù)時(shí)間序列數(shù)據(jù)是按時(shí)間順序排列的數(shù)據(jù),如股票價(jià)格、氣溫變化等。時(shí)間序列數(shù)據(jù)具有趨勢(shì)性、周期性和隨機(jī)性等特點(diǎn)。了解數(shù)據(jù)分布01通過描述統(tǒng)計(jì)方法,可以了解數(shù)據(jù)的分布情況,如數(shù)據(jù)的集中趨勢(shì)、離散程度和偏態(tài)等。這有助于我們更好地把握數(shù)據(jù)的整體特征。發(fā)現(xiàn)數(shù)據(jù)規(guī)律02描述統(tǒng)計(jì)可以幫助我們發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律和趨勢(shì),如通過繪制折線圖或散點(diǎn)圖來觀察數(shù)據(jù)的變化趨勢(shì)。這有助于我們預(yù)測(cè)未來的數(shù)據(jù)走向。為推斷統(tǒng)計(jì)提供基礎(chǔ)03描述統(tǒng)計(jì)是推斷統(tǒng)計(jì)的基礎(chǔ),通過描述統(tǒng)計(jì)方法可以對(duì)數(shù)據(jù)進(jìn)行初步的處理和分析,為后續(xù)的假設(shè)檢驗(yàn)、回歸分析等推斷統(tǒng)計(jì)方法提供必要的數(shù)據(jù)支持。描述統(tǒng)計(jì)在數(shù)據(jù)分析中重要性PART02數(shù)據(jù)收集與整理方法2023REPORTING通過調(diào)查問卷、實(shí)驗(yàn)、觀察等方式直接獲取原始數(shù)據(jù)。原始數(shù)據(jù)收集二手?jǐn)?shù)據(jù)收集網(wǎng)絡(luò)爬蟲技術(shù)從公開數(shù)據(jù)庫、研究報(bào)告、政府統(tǒng)計(jì)資料等獲取已有數(shù)據(jù)。運(yùn)用網(wǎng)絡(luò)爬蟲工具自動(dòng)抓取網(wǎng)頁上的結(jié)構(gòu)化數(shù)據(jù)。030201數(shù)據(jù)來源及收集途徑對(duì)缺失數(shù)據(jù)進(jìn)行填充、插值或刪除等操作。缺失值處理識(shí)別并處理數(shù)據(jù)中的異常值,如離群點(diǎn)、錯(cuò)誤數(shù)據(jù)等。異常值處理將數(shù)據(jù)類型轉(zhuǎn)換為適合分析的形式,如文本轉(zhuǎn)數(shù)值、日期格式轉(zhuǎn)換等。數(shù)據(jù)類型轉(zhuǎn)換數(shù)據(jù)清洗與預(yù)處理技巧將數(shù)據(jù)按比例縮放,使之落入一個(gè)小的特定區(qū)間,如[0,1]或[-1,1]。數(shù)據(jù)歸一化將數(shù)據(jù)轉(zhuǎn)換為均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。數(shù)據(jù)標(biāo)準(zhǔn)化將連續(xù)型數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù),如通過分箱、分段等方式。數(shù)據(jù)離散化數(shù)據(jù)轉(zhuǎn)換和標(biāo)準(zhǔn)化操作PART03數(shù)值型數(shù)據(jù)描述統(tǒng)計(jì)指標(biāo)2023REPORTING中位數(shù)將數(shù)值型數(shù)據(jù)按大小順序排列,位于中間位置的數(shù)。適用于數(shù)值型數(shù)據(jù),反映數(shù)據(jù)的中心趨勢(shì)。均值所有數(shù)值的和除以數(shù)值的個(gè)數(shù)。適用于數(shù)值型數(shù)據(jù),反映數(shù)據(jù)的平均水平。眾數(shù)出現(xiàn)次數(shù)最多的數(shù)。適用于離散型數(shù)據(jù),反映數(shù)據(jù)的集中趨勢(shì)。均值、中位數(shù)和眾數(shù)計(jì)算方法及應(yīng)用場(chǎng)景應(yīng)用場(chǎng)景均值常用于表示一組數(shù)據(jù)的“平均”水平,如平均工資、平均成績等。中位數(shù)用于表示一組數(shù)據(jù)的“中等”水平,特別適用于存在極端值的數(shù)據(jù)集。眾數(shù)用于表示一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù),常用于市場(chǎng)調(diào)研和統(tǒng)計(jì)分析中。01020304均值、中位數(shù)和眾數(shù)計(jì)算方法及應(yīng)用場(chǎng)景01方差各數(shù)值與均值之差的平方的平均數(shù)。反映數(shù)據(jù)的離散程度。02標(biāo)準(zhǔn)差方差的算術(shù)平方根。反映數(shù)據(jù)的波動(dòng)大小。03變異系數(shù)標(biāo)準(zhǔn)差與均值之比。消除單位和平均數(shù)不同對(duì)離散程度比較的影響。04方差S^2=∑(Xi-μ)^2/n,其中Xi為各數(shù)值,μ為均值,n為數(shù)值個(gè)數(shù)。05標(biāo)準(zhǔn)差S=√S^2,即方差的算術(shù)平方根。06變異系數(shù)CV=S/μ,即標(biāo)準(zhǔn)差與均值之比。方差、標(biāo)準(zhǔn)差和變異系數(shù)含義及計(jì)算方法偏態(tài)系數(shù):描述數(shù)據(jù)分布形態(tài)的偏斜程度及方向。正偏態(tài)表示數(shù)據(jù)右偏,負(fù)偏態(tài)表示數(shù)據(jù)左偏。峰態(tài)系數(shù):描述數(shù)據(jù)分布形態(tài)的尖峭程度。峰態(tài)系數(shù)大于0表示數(shù)據(jù)分布比正態(tài)分布更尖峭,小于0則表示更扁平。在數(shù)據(jù)分析中應(yīng)用偏態(tài)系數(shù)可用于判斷數(shù)據(jù)是否服從正態(tài)分布,以及分布的偏斜程度和方向。對(duì)于非正態(tài)分布的數(shù)據(jù),可根據(jù)偏態(tài)系數(shù)進(jìn)行相應(yīng)的變換處理,使其接近正態(tài)分布。峰態(tài)系數(shù)可用于判斷數(shù)據(jù)分布的尖峭程度,以及是否存在異常值或極端值。對(duì)于峰態(tài)系數(shù)較大的數(shù)據(jù)分布,應(yīng)注意異常值或極端值對(duì)分析結(jié)果的影響。0102030405偏態(tài)和峰態(tài)系數(shù)在數(shù)據(jù)分析中應(yīng)用PART04類別型數(shù)據(jù)描述統(tǒng)計(jì)指標(biāo)2023REPORTING根據(jù)數(shù)據(jù)的分布規(guī)律,選擇合適的組數(shù),以充分展示數(shù)據(jù)的分布情況。確定組數(shù)根據(jù)數(shù)據(jù)的波動(dòng)范圍和組數(shù),計(jì)算合適的組距,使得數(shù)據(jù)能夠均勻分布在各個(gè)組內(nèi)。確定組距頻數(shù)分布表制作方法及注意事項(xiàng)根據(jù)組距確定各組上下限,注意上限不在內(nèi)原則。統(tǒng)計(jì)各組內(nèi)的數(shù)據(jù)個(gè)數(shù),得到頻數(shù)分布表。頻數(shù)分布表制作方法及注意事項(xiàng)登記頻數(shù)劃分組限注意事項(xiàng)組距選擇應(yīng)合適,過大可能導(dǎo)致信息損失,過小可能增加數(shù)據(jù)分布的波動(dòng)性。組數(shù)選擇不宜過多或過少,以免損失信息或?qū)е聰?shù)據(jù)分布的偏態(tài)。組限劃分要合理,避免數(shù)據(jù)過于集中或過于分散。頻數(shù)分布表制作方法及注意事項(xiàng)交叉表在類別型數(shù)據(jù)間關(guān)系揭示中作用交叉表定義交叉表是一種用于展示兩個(gè)或多個(gè)類別變量之間關(guān)系的表格,通過計(jì)算不同類別組合下的頻數(shù)或頻率,揭示變量之間的關(guān)系。揭示類別變量間關(guān)系通過交叉表可以清晰地看出不同類別變量之間的組合情況,進(jìn)而分析它們之間的關(guān)系。判斷變量獨(dú)立性通過比較實(shí)際觀測(cè)頻數(shù)與期望頻數(shù)的差異,可以判斷兩個(gè)類別變量是否獨(dú)立。輔助卡方檢驗(yàn)交叉表可以為卡方檢驗(yàn)提供必要的數(shù)據(jù)基礎(chǔ),用于進(jìn)一步分析類別變量間關(guān)系的顯著性。卡方檢驗(yàn)定義卡方檢驗(yàn)是一種用于檢驗(yàn)兩個(gè)或多個(gè)類別變量間關(guān)系顯著性的統(tǒng)計(jì)方法,通過比較實(shí)際觀測(cè)頻數(shù)與期望頻數(shù)的差異,判斷變量間是否存在顯著差異。確定自由度根據(jù)交叉表的行列數(shù)確定自由度。建立假設(shè)提出原假設(shè)和備擇假設(shè),原假設(shè)通常為兩個(gè)類別變量相互獨(dú)立。查找臨界值根據(jù)卡方分布表和顯著性水平查找臨界值。計(jì)算卡方值根據(jù)實(shí)際觀測(cè)頻數(shù)和期望頻數(shù)計(jì)算卡方值。比較并作出結(jié)論將計(jì)算得到的卡方值與臨界值進(jìn)行比較,如果卡方值大于臨界值,則拒絕原假設(shè),認(rèn)為兩個(gè)類別變量間存在顯著差異。卡方檢驗(yàn)在類別型數(shù)據(jù)差異顯著性判斷中應(yīng)用PART05圖表展示技巧在描述統(tǒng)計(jì)中應(yīng)用2023REPORTING柱狀圖折線圖餅圖散點(diǎn)圖常見圖表類型及其適用場(chǎng)景01020304適用于展示不同類別數(shù)據(jù)之間的數(shù)量對(duì)比,如銷售額、人口數(shù)量等。適用于展示時(shí)間序列數(shù)據(jù),反映數(shù)據(jù)隨時(shí)間變化的趨勢(shì),如股票價(jià)格、溫度變化等。適用于展示數(shù)據(jù)的占比關(guān)系,如市場(chǎng)份額、人口比例等。適用于展示兩個(gè)變量之間的關(guān)系,如身高與體重、廣告投入與銷售額等。簡潔明了、突出重點(diǎn)、避免誤導(dǎo)、注重色彩搭配和字體選擇。設(shè)計(jì)原則使用圖表樣式和主題、添加數(shù)據(jù)標(biāo)簽和說明、調(diào)整圖表大小和布局、使用高質(zhì)量的圖像和圖標(biāo)。美觀性提升方法圖表設(shè)計(jì)原則與美觀性提升方法使用Excel的數(shù)據(jù)透視表功能,輕松創(chuàng)建交互式動(dòng)態(tài)圖表。結(jié)合使用Excel的VBA宏編程,實(shí)現(xiàn)更復(fù)雜的動(dòng)態(tài)圖表效果,如自動(dòng)篩選、動(dòng)態(tài)排序等。利用Excel的條件格式功能,實(shí)現(xiàn)數(shù)據(jù)變化時(shí)圖表自動(dòng)更新顏色或形狀。將Excel圖表嵌入到PPT或Word中,實(shí)現(xiàn)數(shù)據(jù)與圖表的實(shí)時(shí)更新和交互。動(dòng)態(tài)圖表制作技巧分享PART06案例實(shí)戰(zhàn):Excel在描述統(tǒng)計(jì)中應(yīng)用2023REPORTING案例背景某電商公司需要對(duì)其銷售數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,以了解銷售情況、客戶行為和市場(chǎng)趨勢(shì)。數(shù)據(jù)準(zhǔn)備從公司數(shù)據(jù)庫中導(dǎo)出所需數(shù)據(jù),包括訂單數(shù)據(jù)、客戶數(shù)據(jù)、產(chǎn)品數(shù)據(jù)等,并進(jìn)行清洗和整理,確保數(shù)據(jù)質(zhì)量和準(zhǔn)確性。案例背景介紹及數(shù)據(jù)準(zhǔn)備工作03數(shù)據(jù)可視化呈現(xiàn)通過圖表、圖形等方式將數(shù)據(jù)可視化呈現(xiàn),以便更直觀地了解數(shù)據(jù)分布和特征。01數(shù)據(jù)導(dǎo)入與整理將清洗后的數(shù)據(jù)導(dǎo)入Excel,創(chuàng)建數(shù)據(jù)透視表或使用其他功能進(jìn)行數(shù)據(jù)整理,以便于后續(xù)分析。02描述性統(tǒng)計(jì)指標(biāo)計(jì)算利用Excel內(nèi)置函數(shù)或數(shù)據(jù)分析工具包,計(jì)算各項(xiàng)描述性統(tǒng)計(jì)指標(biāo),如均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差等。利用Excel進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年寬幅針刺機(jī)項(xiàng)目投資價(jià)值分析報(bào)告
- 2024至2030年中國飲水劑數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024荒山承包協(xié)議承包合同
- 2024影視劇攝制委托貸款合同范本
- 2024員工保密合同【企業(yè)員工保密合同】
- 2024年個(gè)人房屋出租合同協(xié)議書范本
- 2024企業(yè)場(chǎng)地出租合同
- 2024廈門市國有土地使用權(quán)有償出讓合同
- 課程設(shè)計(jì)氣流干燥器摘要
- 商鋪散熱器供暖課程設(shè)計(jì)
- 膈肌保護(hù)性通氣策略專家共識(shí)
- 運(yùn)輸公司貨物托運(yùn)單
- 理解當(dāng)代中國學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫2023年
- 氣體吸收操作-吸收的基本原理認(rèn)知(化工單元操作課件)
- 城市公園景觀設(shè)計(jì)課件
- 刑事案件聘請(qǐng)律師辯護(hù)風(fēng)險(xiǎn)告知書
- 水文水利計(jì)算習(xí)題
- β內(nèi)酰胺類抗菌藥物皮膚試驗(yàn)指導(dǎo)原則(2021年版)解讀
- 水庫工程建設(shè)征地移民安置監(jiān)測(cè)評(píng)估本底調(diào)查報(bào)告
- 市政工程投資估算編制辦法(建標(biāo)2007164號(hào))
- 高中生的人際交往
評(píng)論
0/150
提交評(píng)論