




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五(d w)講 描述性統(tǒng)計數(shù)據(jù)(shj)的描述性測度共五十四頁內(nèi)容提要(ni rn t yo)數(shù)據(jù):隨機性、大量性、變異性數(shù)據(jù)分布:次數(shù)(csh)分布、相對次數(shù)(csh)分布、累積次數(shù)(csh)分布、累積相對次數(shù)(csh)分布數(shù)據(jù)分布規(guī)律:分布中心、分布范圍、對稱性共五十四頁次數(shù)(csh)分布表與圖所謂次數(shù)分布(fnb),也叫頻數(shù)分布(fnb),指的是一批數(shù)據(jù)中各個不同數(shù)值所出現(xiàn)的次數(shù)情況,或者是指一批數(shù)據(jù)在量尺上各等距區(qū)組內(nèi)所出現(xiàn)的次數(shù)情況。把次數(shù)分布情況制成的統(tǒng)計圖表就分別叫做次數(shù)分布圖和次數(shù)分布表。 共五十四頁次數(shù)分布(fnb)表的編制步驟求全(qiqun)距(極差)決定組數(shù)和組距決定
2、組限求組中值登記次數(shù)共五十四頁共五十四頁連續(xù)變量數(shù)據(jù)(shj)的實限連續(xù)變量的每一個值是代表數(shù)軸上的一段距離。這就出現(xiàn)了數(shù)據(jù)的實限問題。一個數(shù)據(jù)所代表的實際范圍稱為(chn wi)該數(shù)據(jù)的實限,包括從等于大于該數(shù)據(jù)的下實限至小于該數(shù)據(jù)的上實限。例子:5(下限為:4.5;上限為:5.5) 5.0 (下限為:4.95;上限為:5.05)共五十四頁共五十四頁相對次數(shù)(csh)分布表相對次數(shù)就是各組的次數(shù)f與總次數(shù)N之間的比值,若以Rf 表示,則Rf = f / N。相對次數(shù)分布表主要能反映各組數(shù)據(jù)(shj)的百分比結(jié)構(gòu)。閱讀相對次數(shù)分布表時,相對次數(shù)較大的組,則說明落入該組內(nèi)的數(shù)據(jù)(shj)個數(shù)占全
3、部數(shù)據(jù)(shj)個數(shù)的比例也越多。反之,則越少。共五十四頁累積次數(shù)(csh)分布表和累積相對次數(shù)(csh)分布表共五十四頁次數(shù)(csh)分布圖次數(shù)(csh)直方圖共五十四頁次數(shù)(csh)分布圖次數(shù)(csh)多邊圖共五十四頁共五十四頁次數(shù)(csh)分布圖累積(lij)次數(shù)分布圖共五十四頁練習(xí)(linx): 某校85班與86班統(tǒng)計學(xué)考試成績(chngj)如表所示。要求對上述兩個班的成績(chngj)用兩種分組辦法進行分組,并利用兩種分組的數(shù)據(jù)對兩班成績(chngj)進行比較和分析。 (1)以10分組距進行等組距分組;(2)如學(xué)校規(guī)定90100分為優(yōu)、7589分為良、6074分為及格、59分以下為不
4、及格,按優(yōu)、良、及格、不及格分組。共五十四頁85班607948766758708277899510065647578558098887883548473809588687492856874726578897684488490856757896986班9174608493647881416160867262516084798082754253628282927675778583817683949490847881727085786392共五十四頁數(shù)據(jù)(shj)的描述性測度中心(zhngxn)測度 平均數(shù);中位數(shù);眾數(shù)變化測度 全距;方差與標(biāo)準(zhǔn)差; 四分位數(shù)和四分位距;極值形態(tài)測度 偏度;峰度共五
5、十四頁(一)中心(zhngxn)測度 中心測度是指刻畫數(shù)據(jù)集中趨勢的數(shù)字,用來描述數(shù)據(jù)的中心位于何處(h ch)。 最常用的中心測度為平均數(shù)、中位數(shù)和眾數(shù),其中平均數(shù)和中位數(shù)只適用于定量數(shù)據(jù),而眾數(shù)既適用于定量數(shù)據(jù),也適用于定性(分類)數(shù)據(jù)。共五十四頁(1)算術(shù)(sunsh)平均數(shù)(M)總體算術(shù)(sunsh)平均數(shù) 樣本算術(shù)平均數(shù)共五十四頁算術(shù)(sunsh)平均數(shù)的特性所有觀察值關(guān)于平均數(shù)的偏差(pinch)和為零,即對極值非常敏感。所有觀察值關(guān)于平均數(shù)的偏差平方和最小。 共五十四頁算術(shù)(sunsh)平均數(shù)的計算利用(lyng)原始數(shù)據(jù)進行計算利用頻數(shù)分布表計算 共五十四頁算術(shù)(sunsh)平
6、均數(shù)的優(yōu)缺點優(yōu)點 反應(yīng)靈敏 嚴(yán)密確定(qudng) 簡明易懂 適合代數(shù)運算 受抽樣變動的 影響較小缺點 易受極端數(shù)值 的影響 一組數(shù)據(jù)中某 個數(shù)值的大小模 糊不清或不夠確 切時無法計算共五十四頁算術(shù)平均數(shù)的幾個(j )特殊優(yōu)點只知一組觀察值的總和及總次數(shù)就可以求出算術(shù)平均數(shù)。用加權(quán)法可以求出幾個平均數(shù)的總平均數(shù)。用樣本數(shù)據(jù)推斷總體集中量時,算術(shù)平均數(shù)最接近于總體集中量的真值,它是總體平均數(shù)的最好估計值。在計算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進行(jnxng)統(tǒng)計推斷時,都要用到它。共五十四頁(2)加權(quán)平均數(shù)加權(quán)平均數(shù)是不同(b tn)比重數(shù)據(jù)(或平均數(shù))的平均數(shù)。用 表示。其計算公式有兩種形式 共五
7、十四頁(3)中位數(shù)定義:中位數(shù)是把按從小到大(從大到?。┡帕械囊唤M數(shù)據(jù)一分為二的數(shù)值。中位數(shù)的計算: 1. 用原始數(shù)據(jù)計算(分奇數(shù)個數(shù)據(jù)和偶數(shù)個數(shù)據(jù)) 2. 利用(lyng)次數(shù)分布表計算 共五十四頁利用次數(shù)(csh)分布表計算中位數(shù)(1)計算公式(由小向大計算) 表示(biosh)中位數(shù)所在組的下限; N表示總頻數(shù); 中位數(shù)所在組的頻數(shù); 表示小于中位數(shù)所在組下限的頻數(shù)綜合。共五十四頁共五十四頁中位數(shù)的優(yōu)缺點與應(yīng)用(yngyng)優(yōu)點:不易受極端值影響缺點:不適合代數(shù)計算應(yīng)用條件:一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時;一組數(shù)據(jù)中兩端數(shù)據(jù)或個別數(shù)據(jù)不確切、不清楚時;當(dāng)需要快速(kui s)估計一
8、組數(shù)據(jù)的代表值時;數(shù)據(jù)資料屬于等級性質(zhì)時。共五十四頁(4)眾數(shù)(zhn sh)眾數(shù)的概念 理論眾數(shù)是指與頻數(shù)分布曲線最高點相對應(yīng)的橫坐標(biāo)上的一點。 粗略眾數(shù)是指一組數(shù)據(jù)(shj)中頻數(shù)出現(xiàn)最多的那個數(shù)。共五十四頁共五十四頁眾數(shù)的計算方法 (1)用觀察法直接尋找眾數(shù) 在頻數(shù)(pn sh)分布表中,頻數(shù)(pn sh)最多一組的組中值就是粗略眾數(shù)。當(dāng)兩個相鄰的組的頻數(shù)(pn sh)都是最多時,那么兩分組的分組點就是眾數(shù)。 共五十四頁(2)皮爾遜的經(jīng)驗法 當(dāng)頻數(shù)分布呈正態(tài)或接近正態(tài)時,皮爾遜發(fā)現(xiàn)眾數(shù)近似(jn s)地等于3倍的中位數(shù)減去2倍的算術(shù)平均數(shù)。眾數(shù)(zhn sh)的計算方法共五十四頁眾數(shù)(z
9、hn sh)的適用情況當(dāng)需要快速而又粗略地找出一組數(shù)據(jù)的代表值時。當(dāng)需要利用算術(shù)平均值、中位數(shù)、眾數(shù)三者關(guān)系來粗略判斷頻數(shù)分布的形態(tài)時。利用眾數(shù)幫助分析(fnx)解釋一組次數(shù)分布是否確實具有兩個次數(shù)最多的集中點時。共五十四頁平均數(shù)、中位數(shù)、眾數(shù)(zhn sh)三者之間的關(guān)系共五十四頁常用中心測度(c du)概括測度特點使用注意事項眾數(shù)適合于描述分類 變量或稱名 變量的趨中程度 不準(zhǔn)確、信息量有限、易產(chǎn)生誤導(dǎo) 中數(shù)如果需要知道數(shù)據(jù)分布的中點或者數(shù)據(jù)分布明顯偏態(tài)時,優(yōu)先使用。對存在的極端高或極端低的數(shù)值不敏感平均數(shù)是最經(jīng)常使用、最容易計算、容易理解的趨中測度對極值很敏感。如果數(shù)據(jù)中存在較多的極值,
10、或者分布明顯偏態(tài),可能產(chǎn)生誤導(dǎo)加權(quán)平均數(shù)需要了解若干容量不同的子群體的總平均分權(quán)重的使用最為重要,尤其是子群體容量明顯不同時共五十四頁(二)變化(binhu)測度 變化測度是描述(mio sh)一組數(shù)據(jù)的變化程度或分散程度的數(shù)值。最常用的變化測度包括: (1)全距(全距=最高分-最低分) (2)方差與標(biāo)準(zhǔn)偏差 (3)四分位差 (4)極值共五十四頁(2)平均差、方差(fn ch)與標(biāo)準(zhǔn)差 平均差(MD):就是每一個數(shù)據(jù)(shj)與該組數(shù)據(jù)(shj)的中位數(shù)(或算術(shù)平均數(shù))離差的絕對值的算術(shù)平均數(shù)。共五十四頁平均差的優(yōu)缺點 與極差相比,平均差是利用全部數(shù)據(jù)信息計算的,意義明確,計算容易,較好地度量
11、了次數(shù)分布的離散(lsn)程度。但計算要用到絕對值,使它的應(yīng)用大大受到限制。共五十四頁方差(fn ch)方差是指離差平方和的算術(shù)平均數(shù)。用 表示。 方差雖然避免了絕對值的麻煩,但卻又使變量(binling)的單位變成原單位的平方。共五十四頁標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是指離差平方和平均后的方根,即方差(fn ch)的平方根。用 表示。共五十四頁方差(fn ch)與標(biāo)準(zhǔn)差的優(yōu)缺點優(yōu)點:反映靈敏,嚴(yán)密確定,計算簡單(jindn),用樣本數(shù)據(jù)推斷總體差異量時,方差與標(biāo)準(zhǔn)差是最好的估計量。缺點:易受極端數(shù)值的影響,有個別數(shù)據(jù)模糊不清時便無法計算。共五十四頁(3)四分(s fn)位差百分位數(shù):就是次數(shù)分布中相對于某個特
12、定百分點的原始分?jǐn)?shù)。百分位數(shù)的計算公式如下:Pm第m百分位數(shù);LPm所在(suzi)組的組下限;fPm所在組的次數(shù);Fb小于L的累計次數(shù)。 共五十四頁共五十四頁百分位差百分位差:是指兩個(lin )百分位數(shù)之差。常用的有:共五十四頁四分(s fn)位差 若將從小到大排列的一組數(shù)據(jù)分成頻數(shù)相等(xingdng)的四段,第一與第二段的分界點稱為第一個四分位數(shù)。第三段與第四段的分界點稱為第三個四分位數(shù)。則四分位差就是第三個四分位數(shù)(第75百分位數(shù))與第一個四分位數(shù)(第25百分位數(shù))的差。公式為:共五十四頁極差、百分位差、四分(s fn)位差 極差:最簡單、最易理解的差異量數(shù),但也是最粗糙、最不可靠(
13、kko)的值。 級差明顯地受取樣變動的影響,一般情況下主要用于對數(shù)據(jù)做預(yù)備性檢查,了解數(shù)據(jù)的大概散布范圍,以便確定如何進行統(tǒng)計分組。 百分位差與四分位差:與極差相比,避免了極端數(shù)據(jù)的影響,但由于沒有把全部數(shù)據(jù)考慮在內(nèi),其穩(wěn)定性會差一些。 另外,它們也不適合代數(shù)方法運算,反應(yīng)不夠靈敏,應(yīng)用不多。共五十四頁(4)極值(j zh) 極值是指位于數(shù)據(jù)總體分布之外的一些(yxi)極端的數(shù)值。極值的產(chǎn)生可能主要有下列原因: (1)極值是真的測量結(jié)果; (2)可能是由于數(shù)據(jù)記錄或錄入誤差造成的; (3)極值數(shù)據(jù)可能來自其他總體。共五十四頁確定(qudng)極值的方法 統(tǒng)計學(xué)上通常(tngchng)用四分位數(shù)
14、和四分位距作為確定極值的工具,過程如下: (1)首先根據(jù)四分位數(shù)和四分位距確定數(shù)據(jù)分布的上、下限: 下限=Q1-.1.5IQR;上限=Q3+1.5IQR (2)小于下限和大于上限的觀察值就是潛在的極值。 (3)確定了潛在的觀察值后,可以用直方圖、莖葉圖等進一步檢查這些觀察值是否真的是極值。共五十四頁(三)分布(fnb)形態(tài)測度偏度:是描述(mio sh)數(shù)據(jù)分布對稱性的測度。共五十四頁偏度數(shù)據(jù)(shj)呈對稱分布,此時平均數(shù)與中數(shù)相等;數(shù)據(jù)呈正偏態(tài),此時平均數(shù)大于中數(shù);數(shù)據(jù)呈負(fù)偏態(tài),此時平均數(shù)小于中數(shù)。共五十四頁共五十四頁峰度 峰度是描述數(shù)據(jù)圍繞平均數(shù)分布的緊密(jnm)程度,或者分散程度。共五十四頁峰度 與平均數(shù)、標(biāo)準(zhǔn)偏差一樣,峰度對極端值的存在非常敏感。統(tǒng)計學(xué)上,將數(shù)據(jù)分布分為三種類型,即常峰態(tài)、低峰態(tài)和尖峰態(tài)。 數(shù)據(jù)呈常峰態(tài)。一般而言,鐘型分布和正態(tài)分布都是常峰態(tài)的。 數(shù)據(jù)呈低峰態(tài),即中間部分的數(shù)據(jù)較少,相當(dāng)一部分?jǐn)?shù)據(jù)分布在兩端極端高或極端低的位置,而且(r qi)這種分布的偏度指數(shù)一般不太高。 數(shù)據(jù)呈尖峰態(tài),即相當(dāng)一部分?jǐn)?shù)據(jù)分布在少數(shù)的位置,這個位置可以是靠中間的位置,也可以是靠某一端的位置,其他位置的數(shù)據(jù)分布明顯較少。共五十四頁共五十四頁內(nèi)容摘要第五講 描述性統(tǒng)計。某校85班與86班統(tǒng)計學(xué)考試成績?nèi)绫硭?。?)以10分組距進行等組距分組。總體算術(shù)平均數(shù)。樣本算術(shù)平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小兒巨大血小板綜合征的健康宣教
- 縱膈腫瘤診斷
- 小學(xué)一年級數(shù)學(xué)20以內(nèi)三個數(shù)加減混合運算家庭作業(yè)題
- 巨血小板綜合征的健康宣教
- 患者投訴快速響應(yīng)管理制度
- 2024屆四川師大七中學(xué)九中學(xué)重點中學(xué)中考四模數(shù)學(xué)試題含解析
- 安全管理如何在班組落地
- 2025工程咨詢服務(wù)合同書模板
- 網(wǎng)絡(luò)工程師應(yīng)用技術(shù)真題100道及答案
- 環(huán)境生態(tài)工程單選題100道及答案解析
- 電纜溝、電纜管、電纜井專項施工方案
- 2024年公務(wù)員考試中財務(wù)知識的考察試題及答案
- 《人工智能技術(shù)基礎(chǔ)》課件-第六章 知識圖譜
- 2025年山東省濟南市市中區(qū)中考物理一模試卷(無答案)
- (三模)吉林市2025屆高三第三次模擬測試 英語試卷(含答案詳解)
- 2024-2030年中國驅(qū)蚊用品行業(yè)市場深度分析及投資策略研究報告
- DL∕T 1751-2017 燃?xì)?蒸汽聯(lián)合循環(huán)機組余熱鍋爐運行規(guī)程
- 呼吸內(nèi)科利用品管圈PDCA循環(huán)提高患者對無創(chuàng)呼吸機的有效使用率
- 創(chuàng)傷后應(yīng)激障礙(PTSD)
- 文言文王安石《答司馬諫議書》司馬光《與王介甫書》閱讀練習(xí)及答案
- 松木樁地基處理計算表格(自動版)
評論
0/150
提交評論