




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1,除了統(tǒng)計(jì)圖和統(tǒng)計(jì)表之外,還可以用少量的特征值(代表值)對(duì)數(shù)據(jù)分布的數(shù)量規(guī)律進(jìn)行精確、簡(jiǎn)潔的描述,第三章 數(shù)據(jù)分布特征的統(tǒng)計(jì)描述,2,大量的數(shù)據(jù)經(jīng)過(guò)整理后,已經(jīng)能初步反映總體分布的特征。 為了更加準(zhǔn)確的了解數(shù)據(jù)分布的特征和規(guī)律,需要找到反映數(shù)據(jù)分布特征的代表值,三類(lèi):集中趨勢(shì)、離中趨勢(shì)、分布形態(tài),說(shuō)明,3,集中趨勢(shì):即反映各數(shù)據(jù)向中心值靠攏的程度,返回本節(jié)首頁(yè),4,離中趨勢(shì):即反映各數(shù)據(jù)遠(yuǎn)離中心值的程度,兩個(gè)不同的曲線(xiàn)表示兩個(gè)不同的總體,它們的 集中趨勢(shì)相同但離中趨勢(shì)不同,因?yàn)榧词宫F(xiàn)象的集中趨勢(shì)相同,其離中趨勢(shì) 也可能不同,5,實(shí)際中還會(huì)遇到:集中趨勢(shì)和離中趨勢(shì)均相同的現(xiàn)象,其分布的形態(tài)也可
2、能不同,這表明:除了集中和離中趨勢(shì)外,分布還有其他方面的特征:分布的形態(tài),指:數(shù)據(jù)分布的對(duì)稱(chēng)程度和扁平(高低)程度,測(cè)度指標(biāo)是偏度,測(cè)度指標(biāo)是峰度,是相對(duì)于對(duì)稱(chēng)分布而言,相對(duì)于正態(tài)分布而言,6,偏度:測(cè)定分布的偏斜程度的指標(biāo),偏斜是相對(duì)于對(duì)稱(chēng)分布而言,峰度:測(cè)定分布的高低(尖峭)程度的指標(biāo),尖峭是相對(duì)于正態(tài)分布而言,7,正態(tài)分布,對(duì)稱(chēng)分布,8,峰態(tài),偏態(tài),與對(duì)稱(chēng)分 布比較,9,正態(tài)分布中有兩個(gè)參數(shù),一般記為,2 是正態(tài)分布的參數(shù),不確定常數(shù)。 不同的、不同的2對(duì)應(yīng)不同的正態(tài)分布,10,標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布中的一種,記為,11,本章內(nèi)容,第一節(jié) 集中趨勢(shì)的測(cè)度 第二節(jié) 離散程度的測(cè)度 第三節(jié)
3、偏度與峰度,12,第一節(jié) 集中趨勢(shì)的測(cè)度,集中趨勢(shì)是指一組數(shù)據(jù)向其中心值靠攏的傾向 測(cè)度集中趨勢(shì)就是尋找一組數(shù)據(jù)的代表值或中心值,在統(tǒng)計(jì)中是使用平均指標(biāo)來(lái)測(cè)度的,13,本節(jié)內(nèi)容,一、平均指標(biāo)含義 二、平均指標(biāo)的計(jì)算 (一)算術(shù)平均數(shù) (二)調(diào)和平均數(shù) (三)幾何平均數(shù) (四)眾數(shù) (五)中位數(shù) 三、各種平均數(shù)之間的相互關(guān)系,數(shù)值平均,位置平均,14,一、平均指標(biāo)含義,1、定義:又稱(chēng)平均數(shù)。 是將同質(zhì)總體內(nèi)各單位的數(shù)量差異抽象化,以反映總體的一般水平,被平均的對(duì)象必須具有同質(zhì)性,15,2、平均指標(biāo)有兩大類(lèi),數(shù)值平均,位置平均,根據(jù)總體內(nèi)全部數(shù)據(jù)計(jì)算:算術(shù)平均、調(diào)和平均、幾 何平均,根據(jù)數(shù)據(jù)在分配
4、數(shù)列中的位置確定:眾數(shù)、中位數(shù),16,3、平均指標(biāo)作用,a、反映總體各單位變量值分布的集中趨勢(shì) b、比較同一現(xiàn)象在不同空間或不同時(shí)間的發(fā)展 水平 c、分析現(xiàn)象間的依存關(guān)系,17,集中趨勢(shì),總體中各單位某一標(biāo)志值的具體表現(xiàn)是各不相 同的,但一般呈正態(tài)分布,即很小或很大的標(biāo) 志值出現(xiàn)的次數(shù)較少,接近平均數(shù)的標(biāo)志值出 現(xiàn)的次數(shù)較多,大多數(shù)的標(biāo)志值都圍繞著平均 數(shù)左右波動(dòng),返回本節(jié)首頁(yè),18,現(xiàn)象間的依存關(guān)系,19,二、平均指標(biāo)計(jì)算,一)算術(shù)平均數(shù),又稱(chēng)均值。根據(jù)掌握的資料不同: 簡(jiǎn)單法和加權(quán)法,20,1、簡(jiǎn)單法:適用于沒(méi)有分組的原始數(shù)據(jù),均值,即算術(shù)平均數(shù),x 標(biāo)志值或變量值,見(jiàn)49頁(yè)例題,21,2
5、、加權(quán)法:分組且各組標(biāo)志值出現(xiàn)的次數(shù) (權(quán)數(shù) f )不相等時(shí),公式,返回本節(jié)首頁(yè),x 為標(biāo)志值,又稱(chēng)變量值; f 為各組標(biāo)志值出現(xiàn)的次數(shù),22,計(jì)算平均日產(chǎn)量,23,24,用統(tǒng)計(jì)功能的計(jì)算器計(jì)算: 2ndF,ON, 201M+ 224M+ 246M+ 268M+ 2812M+ 3010M+, xM 結(jié)果為26.73,25,例1:用計(jì)算器對(duì)下列數(shù)據(jù)求平均,26,mode2 Shift scl = 25 Shift;10 DT 35 Shift;70 DT 45 Shift;90DT 55 Shift;30 DT Shift,注意: DT是儲(chǔ)存功能的加號(hào),27,注意:當(dāng)各組權(quán)數(shù)均相等時(shí),加權(quán)算術(shù)平
6、均數(shù) 等于簡(jiǎn)單算術(shù)平均數(shù),返回本節(jié)首頁(yè),28,可用簡(jiǎn)單式計(jì)算均值,各組權(quán)數(shù)都相等的數(shù)列,29,對(duì)稱(chēng)數(shù)列,可用簡(jiǎn)單式計(jì)算均值,30,3、權(quán)數(shù),加權(quán)均值的大小受兩個(gè)因素的影響: 各組變量值(x) 各組次數(shù),即權(quán)數(shù)(f,31,1)權(quán)數(shù)的定義,權(quán)數(shù):即次數(shù),分布在各組間的總體單位數(shù), 因?yàn)樗鼘?duì)均值的大小起權(quán)衡輕重的作 用,故又稱(chēng)權(quán)數(shù),出現(xiàn)次數(shù)多的標(biāo)志值 對(duì)平均數(shù)的影響大,32,2)權(quán)數(shù)的表現(xiàn)及應(yīng)用,絕對(duì)數(shù)權(quán)數(shù) f 相對(duì)數(shù)權(quán)數(shù),第一、權(quán)數(shù)表現(xiàn):有兩種形式,33,絕對(duì)權(quán)數(shù),相對(duì)權(quán)數(shù),計(jì)算公式,例題見(jiàn)教科書(shū)51頁(yè)表33,34,第二、權(quán)數(shù)的實(shí)質(zhì),是相對(duì)數(shù)權(quán)數(shù)。 即權(quán)數(shù)對(duì)均值的影響作用,取決于相對(duì)權(quán)數(shù)而非絕對(duì)權(quán)
7、數(shù),舉例,35,計(jì)算平均獎(jiǎng)金額,雖然各組絕對(duì)人數(shù)變化了,但各組人數(shù)的比重未變,比重,10,37.5,52.5,100,36,4、平均數(shù)應(yīng)用舉例,統(tǒng)計(jì)中有三大綜合指標(biāo): 總量指標(biāo)、相對(duì)指標(biāo)和平均指標(biāo),反映現(xiàn)象總規(guī)模、總水平,用絕對(duì)數(shù)表示 如:2019年中國(guó)GDP 39.8萬(wàn)億元人民幣,相對(duì)指標(biāo)是兩個(gè)有聯(lián)系的指標(biāo)值對(duì)比的比率, 如:三次產(chǎn)業(yè)比重、企業(yè)勞動(dòng)生產(chǎn)率、產(chǎn)出的 計(jì)劃完成百分?jǐn)?shù)、經(jīng)濟(jì)發(fā)展速度和增長(zhǎng)速度,37,例1、10個(gè)企業(yè)資金利潤(rùn)率資料,求:10個(gè)企業(yè)的平均利潤(rùn)率,企業(yè)的平均利潤(rùn)率” 等同于 “企業(yè)的總利潤(rùn)率,企業(yè)的總利潤(rùn)率 = 利潤(rùn)總額 / 資金總額,39,利潤(rùn)總額,資金總額,40,計(jì)算
8、150個(gè)企業(yè)的平均計(jì)劃完成百分?jǐn)?shù),例2、150個(gè)企業(yè)的資料,150個(gè)企業(yè)的平均計(jì)劃完成百分?jǐn)?shù)” 就是“150個(gè)企 業(yè)總的計(jì)劃完成百分?jǐn)?shù),企業(yè)總計(jì)劃完成百分?jǐn)?shù) = 總實(shí)際數(shù) / 總計(jì)劃數(shù),42,實(shí)際產(chǎn)值,計(jì)劃產(chǎn)值,43,5、算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì),見(jiàn)52頁(yè),44,二)調(diào)和平均數(shù),1、含義:總體內(nèi)各個(gè)變量值倒數(shù)的算術(shù)平均 數(shù)的倒數(shù),又稱(chēng)倒數(shù)平均數(shù),如有三個(gè)變量值: 8、10、12,求調(diào)和平均數(shù)。步驟如下,45,即為調(diào)和平均數(shù),公式,46,1)簡(jiǎn)單式,2)加權(quán)式,各變量值出現(xiàn)次數(shù)相等,各變量值出現(xiàn)次數(shù)不等,設(shè) m為次數(shù),2、 調(diào)和平均數(shù)的計(jì)算,47,舉例,某蔬菜單價(jià)早中晚分別為0.5、0.4、 0.2
9、5(元/斤) (1)早中晚各買(mǎi)1元,求平均價(jià)格 (2)早中晚各買(mǎi)1斤,求平均價(jià)格 (3)早中晚各買(mǎi)2元、3元、4元,求平均價(jià)格 (4)早中晚各買(mǎi)2斤、3斤、4斤,求平均價(jià)格,48,1)問(wèn):用調(diào)和平均。先求早、中、晚購(gòu)買(mǎi)的斤 數(shù)。早 1/0.5=2(斤) 、中 1/0.4=2.5(斤)、晚 1/0.25=4(斤,2)問(wèn):用算術(shù)平均,49,3)問(wèn):用加權(quán)調(diào)和平均,4)問(wèn):用加權(quán)算術(shù)平均,50,3、調(diào)和平均數(shù)和算術(shù)平均數(shù)間的關(guān)系,調(diào)和平均數(shù)是一種特殊的均值,1)兩者存在著變形關(guān)系,51,2)當(dāng)掌握的資料無(wú)法直接計(jì)算算術(shù)平均數(shù)時(shí),可用調(diào)和法計(jì)算,這時(shí)兩者計(jì)算結(jié)果相同,只是根據(jù)已知 條件不同,需選擇不同
10、的公式,52,已知對(duì)比分母,將分母定為f,求分子xf,然后用加權(quán)算術(shù)公式,即,已知對(duì)比分子,將分子定為m,求分母mx 用加權(quán)調(diào)和公式,即,53,某公司下屬三個(gè)部門(mén)銷(xiāo)售利潤(rùn)資料,求三個(gè)部門(mén)的平均利潤(rùn)率,54,思考: 如果已知銷(xiāo)售利潤(rùn)率和銷(xiāo)售額資料, 該如何計(jì)算,55,56,計(jì)算:20個(gè)商店平均銷(xiāo)售計(jì)劃完成程度及總的流通費(fèi)用率,57,58,1)20個(gè)商店的平均銷(xiāo)售計(jì)劃完成程度,2)20個(gè)商店總的流通費(fèi)用率,59,三)幾何平均數(shù),1.定義: n 個(gè)變量值乘積的 n 次方根,60,3、計(jì)算方法,簡(jiǎn)單法,加權(quán)法,61,例1:2019-2019年我國(guó)某工業(yè)品產(chǎn)量環(huán)比發(fā) 展速度分別為107.6%、102.5
11、%、100.6%、 102.7%、102.2%。計(jì)算平均每年的發(fā)展速度,62,按計(jì)算器:1.076,1.025, ,1.006, ,1.027, ,1.022,=,2ndF,5,出現(xiàn)結(jié)果:1.0309 即103.1,63,例2:某廠(chǎng)有四個(gè)流水連續(xù)作業(yè)車(chē)間,某月的合格率分別為:0.95,0.92,0.90,0.80,求四個(gè)車(chē)間的平均合格率,64,例3:某地區(qū)25年的年經(jīng)濟(jì)發(fā)展速度分別是: 1年103%,4年105%,8年108%, 10年 110%,2年115%, 求該地區(qū)經(jīng)濟(jì)的平均年發(fā)展速度,65,1.03,(,1.05,yx,4,),(,1.08,yx,8,), ,(,1.1,yx,10,)
12、,(,1.15,yx,2,), =,2ndF,25,出現(xiàn)結(jié)果:1.086 即108.6,66,4、使用幾何平均法注意問(wèn)題,第一、變量值要是相對(duì)數(shù),且不能為負(fù)值或零,第二、這些相對(duì)數(shù)的連乘積要等于總速度或總比率,幾何平均法適用于對(duì)比率數(shù)據(jù)(相對(duì)數(shù))的平均, 主要用于計(jì)算平均比率和平均速度,67,幾何平均數(shù)是一種特殊的均值,可寫(xiě)成,68,四)眾數(shù),1、定義: 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,2、計(jì)算:分兩種情況,品質(zhì)數(shù)列和單項(xiàng)式數(shù)列 組距式數(shù)列,69,Mo可口可樂(lè),1)品質(zhì)數(shù)列計(jì)算眾數(shù),定性變量,70,Mo不滿(mǎn)意,甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布,71,眾數(shù)是數(shù)列中出現(xiàn)次數(shù)最多的變量值,眾數(shù),2
13、)單項(xiàng)數(shù)列計(jì)算眾數(shù),定性變量,72,3)組距式數(shù)列計(jì)算眾數(shù),先確定眾數(shù)所在的組,然后用公式計(jì)算 分:上限公式和下限公式,返回本節(jié)首頁(yè),定性變量,73,分?jǐn)?shù)x 人數(shù) f 60以下 2 6070 7 7080 15 8090 10 90以上 6 合計(jì) 40,fm-1,fm+1,fm,L :眾數(shù)所在組的下限 U :眾數(shù)所在組的上限,74,上限公式,下限公式,75,76,3、眾數(shù)說(shuō)明,1)不受極端值的影響 (2)既適用于品質(zhì)數(shù)列,也適用于變量數(shù)列 (3)一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù),返回本節(jié)首頁(yè),77,無(wú)眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8,多于一個(gè)眾數(shù)原始數(shù)據(jù): 25 28 28 36 4
14、2 42,一個(gè)眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5,78,五)中位數(shù),1、中位數(shù)的含義: 將各單位標(biāo)志值按大小排列,居于中間位 置的那個(gè)標(biāo)志值,返回本節(jié)首頁(yè),79,2、中位數(shù)的計(jì)算,分兩種情況: (1)未分組原始資料 (2)組距式數(shù)據(jù),返回本節(jié)首頁(yè),80,1)未分組原始資料,先將數(shù)據(jù)從小到大排序,項(xiàng)數(shù)為奇數(shù)時(shí),中間位置 上的標(biāo)志值即為中位數(shù),項(xiàng)數(shù)為偶數(shù)時(shí),中間位置 上2個(gè)標(biāo)志值的平均為中位數(shù),81,有9個(gè)數(shù)值: 2、3、5、6、9、10、11、13、14 中位數(shù)為第5個(gè),即9 有10個(gè)數(shù)值: 2、3、5、6、9、10、11、13、14、15 中位數(shù)為第5、第6個(gè)數(shù)據(jù)的平均值,即9.5,82,
15、2)組距數(shù)列,fm,SMe+1,SMe-1,83,B、確定中位數(shù)所在的組: 本例為: 40/2=20,即中位數(shù)應(yīng)在將分?jǐn)?shù)從 高到低排列后的第20個(gè)學(xué)生的分?jǐn)?shù)上,A、先將次數(shù)進(jìn)行累計(jì),C、利用公式計(jì)算中位數(shù) ( 公式 見(jiàn)56頁(yè),84,公式,下限公式= 上限公式,85,帶入資料得,分) (分,86,附:四分位數(shù),四分位數(shù):是指位于全部數(shù)據(jù) 位置和 位 置上的數(shù)據(jù),分別稱(chēng)為下四分位數(shù)和上四分位 數(shù)。也稱(chēng)為第一個(gè)四分位數(shù) 和 第三個(gè)四分位數(shù),即:排序后處于25%和75%位置上的值。 實(shí)際上,中位數(shù)就是第二個(gè)四分位數(shù),87,四分位的位置,88,箱線(xiàn)圖:可以觀察數(shù)據(jù)分布的特征,4,6,8,10,12,Me
16、dian/Quart./Range箱線(xiàn)圖,Me,89,某電腦公司2019年前四個(gè)月120天的銷(xiāo)售量數(shù)據(jù),試?yán)孟渚€(xiàn)圖對(duì)數(shù)據(jù)分布特征進(jìn)行分析,90,未分組數(shù)據(jù)單批數(shù)據(jù)箱線(xiàn)圖,91,某電腦公司銷(xiāo)量分組表,未分組數(shù)據(jù)多批數(shù)據(jù)箱線(xiàn)圖,從某大學(xué)經(jīng)濟(jì)管理專(zhuān)業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門(mén)主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如表。試通過(guò)多批箱線(xiàn)圖分析各科考試成績(jī)的分布特征,93,未分組數(shù)據(jù)多批數(shù)據(jù)箱線(xiàn)圖,8門(mén)課程考試成績(jī)的Median/Quart./Range箱線(xiàn)圖,94,11名學(xué)生8門(mén)課程考試成績(jī)的Median/Quart./Range箱線(xiàn)圖,未分組數(shù)據(jù)多批數(shù)據(jù)箱線(xiàn)圖,95,96,三、各種平均數(shù)之間的
17、關(guān)系,兩者都屬于抽象化的代表值,但有區(qū)別, 前者容易受極端值的影響,后者不會(huì),1、數(shù)值平均數(shù)和位置平均數(shù)的比較,97,某公司中層干部2019年的收入,求平均收入,職位 收入(元) 財(cái)務(wù)部經(jīng)理 10 000 市場(chǎng)部經(jīng)理 450000 人事部經(jīng)理 90 000 研發(fā)部經(jīng)理 100 000 生產(chǎn)部經(jīng)理 10 000,實(shí)際中可利用切尾平均法:去掉極端值, 將剩余的數(shù)據(jù)求平均,98,收入(元) 人數(shù) 1000 5 3000 25 5000 56 10000 10 50000 3 30000000 1,計(jì)算其平均收入時(shí), 位置平均和數(shù)值平均哪一種方法更合適,99,2、三種平均數(shù)之間的關(guān)系,有極小值,拉動(dòng)均
18、 值向極小值靠近,有極大值,拉動(dòng)均值向極大值靠近,100,眾數(shù)、中位數(shù)、平均數(shù)的特點(diǎn)和應(yīng)用,眾數(shù):不受極端值影響 具有不惟一性 數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)應(yīng)用 中位數(shù):不受極端值影響 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用 平均數(shù):易受極端值影響 數(shù)據(jù)對(duì)稱(chēng)分布或接近對(duì)稱(chēng)分布時(shí)應(yīng)用,101,離散程度是測(cè)定數(shù)據(jù)分布特征的另一重要指標(biāo),第二節(jié) 離散程度測(cè)度,統(tǒng)計(jì)是使用變異指標(biāo)來(lái)測(cè)度分布的離散程度,用于測(cè)定一組數(shù)據(jù)中各數(shù)值之間的差異程度, 即:在一個(gè)分布中各數(shù)值與均值的離差程度,102,三個(gè)集中趨勢(shì)相同但離中趨勢(shì)不同的總體,離散程度指標(biāo)可從另一個(gè)角度說(shuō)明集中趨勢(shì)測(cè)度值的代表程度,103,一、變異指標(biāo)的意義
19、和作用 二、變異指標(biāo)的種類(lèi) (一)全距(極差) (二)平均差 (三)標(biāo)準(zhǔn)差 (四)離散系數(shù),返回本章首頁(yè),本節(jié)內(nèi)容,104,一、變異指標(biāo)的意義和作用,變異指標(biāo)的含義 又稱(chēng)標(biāo)志變動(dòng)度、離散程度或離中程度。 是描述總體內(nèi)各數(shù)據(jù)之間差別大小程度的指標(biāo),返回本節(jié)首頁(yè),甲:20,40,60,70,80,100,120 乙:67,68,69,70,71,72,73,如兩組數(shù)據(jù),請(qǐng)直觀判斷哪一組的離散程度大,105,70,70,返回本節(jié)首頁(yè),106,標(biāo)志變動(dòng)度的作用,2、能衡量現(xiàn)象變動(dòng)的均衡性或穩(wěn)定性,3、能反映各變量值分布的離散程度(離中趨勢(shì),1、是評(píng)價(jià)平均數(shù)代表性的依據(jù),甲企業(yè) 25 25 25 25
20、均勻、協(xié)調(diào) 乙企業(yè) 10 15 20 55 丙企業(yè) 5 10 15 70 不均勻,企業(yè)產(chǎn)值各季度計(jì)劃完成情況,107,平均數(shù)的代表性和標(biāo)志變動(dòng)度的關(guān)系,標(biāo)志變動(dòng)度大,平均數(shù)的代表性就小; 反之 ,平均數(shù)的代表性就大 例如:三組學(xué)生的年齡(歲) 20 20 20 20 20 -差距最小,20歲的代表性最好 18 19 20 21 22 15 16 20 24 25-差距最大,20 歲的代表性最差,108,二、標(biāo)志變異指標(biāo)的種類(lèi),全距 1、含義:總體各單位標(biāo)志的最大值和最小值之差。 R = Xmax-Xmin,109,2、全距的優(yōu)點(diǎn)和缺點(diǎn),優(yōu)點(diǎn):計(jì)算簡(jiǎn)單、涵義直觀,缺點(diǎn):易受極端數(shù)值的影響 不能反
21、映中間標(biāo)志值的變動(dòng),110,附:四分位差(見(jiàn) 60 頁(yè),四分位差Qd = Q3 - Q1,111,二)平均差,1、含義 是各變量值與其算術(shù)平均數(shù)離差絕對(duì)值 的算術(shù)平均數(shù),即,平均差能全面反映一組數(shù)據(jù)的離散狀況,112,2、平均差計(jì)算,返回本節(jié)首頁(yè),簡(jiǎn)單式,加權(quán)式,113,18 19 20 21 22,2 -1 0 1 2,2 1 0 1 2,x,合計(jì) - 6,一組學(xué)生年齡: 18 19 20 21 22 求平均差,114,某廠(chǎng)200個(gè)工人產(chǎn)量資料(單位:公斤,日產(chǎn)量 30以下 3040 4050 50以上 合計(jì) 求A.D,工人數(shù) 10 70 90 30 200,115,X 25 35 45 5
22、5 合計(jì),17 -7 3 13,f 10 70 90 30 200,17 7 3 13,170 490 270 390 1320,250 2450 4050 1650 8400,116,結(jié)論: 該廠(chǎng)工人平均日產(chǎn)量為42公斤,但各工人生產(chǎn)水平有差異,其差異平均為6.6公斤,117,3、平均差的優(yōu)缺點(diǎn),優(yōu)點(diǎn):和全距相比,彌補(bǔ)了全距不足,能反 映中間標(biāo)志值的變動(dòng)。 缺點(diǎn):加絕對(duì)值號(hào)為計(jì)算帶來(lái)了不便,118,三)標(biāo)準(zhǔn)差(均方差,1、概念 是各變量值與其算術(shù)平均數(shù)離差平方的算術(shù) 平均數(shù)的平方根,又稱(chēng)均方差,119,2、計(jì)算: 已知資料不同采用不同方法,加權(quán)式,簡(jiǎn)單式,120,標(biāo)準(zhǔn)差的平方即為方差,121
23、,一組學(xué)生年齡: 18 19 20 21 22 18 -2 4 19 -1 1 20 0 0 21 1 1 22 2 4 合計(jì) - 10,簡(jiǎn)單式舉例,122,某廠(chǎng)200個(gè)工 人產(chǎn)量資料: (單位:公斤,日產(chǎn)量 30以下 3040 4050 50以上 合計(jì),工人數(shù) 10 70 90 30 200,求標(biāo)準(zhǔn)差,加權(quán)式舉例,123,x 25 35 45 55 合計(jì),17 -7 3 13,f 10 70 90 30 200,289 49 9 169,2890 3430 810 5070 12200,250 2450 4050 1650 8400,124,標(biāo)準(zhǔn)差的計(jì)算可以用統(tǒng)計(jì)功能的計(jì)算器,結(jié)論: 各工人
24、生產(chǎn)產(chǎn)量與平均產(chǎn)量相比,平均相差7.8公斤,125,計(jì)算器的使用,開(kāi)機(jī):ON,2ndF,ON 進(jìn)入到統(tǒng)計(jì)功能后,用計(jì)算平均數(shù)的方法輸數(shù)據(jù) 所有的數(shù)據(jù)輸完后,按 2ndF 鍵, 再按xM 健,即為標(biāo)準(zhǔn)差,注意:所有的數(shù)據(jù)輸完后,如果直接 按xM 健,即為平均數(shù),126,統(tǒng)計(jì)功能的計(jì)算器的使用 Mode2 Shift scl = 25 Shift;10 DT 35 Shift;70 DT 45 Shift;90 DT 55 Shift;30 DT Shift,127,3、標(biāo)準(zhǔn)差的優(yōu)缺點(diǎn),優(yōu)點(diǎn):彌補(bǔ)了平均差和全距的不足。 缺點(diǎn):利用標(biāo)準(zhǔn)差不能比較性質(zhì)不同的數(shù)列(即水平高低不等和計(jì)量單位不同)離散程度
25、的大小,128,如:兩組動(dòng)物體重(單位:公斤,甲: , , 乙:, 試比較平均數(shù)的代表性,129,130,上述結(jié)論不一定正確,因?yàn)椋簝山M數(shù)據(jù)性質(zhì)不同(水平高低不等或者計(jì)量單位不同),不能直接用標(biāo)準(zhǔn)差(或平均差)比較平均數(shù)的代表性。須用相對(duì)離散程度指標(biāo) 離散系數(shù),131,四)離散系數(shù),又稱(chēng)變異系數(shù),是一組相對(duì)數(shù)形式的變異指標(biāo) 有全距系數(shù)、平均差系數(shù)、標(biāo)準(zhǔn)差系數(shù)等等 以標(biāo)準(zhǔn)差系數(shù)為例說(shuō)明其計(jì)算,132,對(duì)于上例,133,總結(jié),比較兩組數(shù)據(jù)的離散程度,即比較平均數(shù)的代表性時(shí): 如果兩組數(shù)據(jù)的平均數(shù)相等且計(jì)量單位相同,可直接使用標(biāo)準(zhǔn)差比較; 除此之外,均需使用標(biāo)準(zhǔn)差系數(shù)比較,134,對(duì)稱(chēng)鐘形分布特點(diǎn):
26、以均值為中心兩邊對(duì)稱(chēng), 且中間數(shù)據(jù)出現(xiàn)的頻數(shù)多而兩尾出現(xiàn)的頻數(shù)少,附:標(biāo)準(zhǔn)差的應(yīng)用,約有68%數(shù)據(jù)在均值加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有95%數(shù)據(jù)在均值加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi) 約有99%數(shù)據(jù)在均值加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),1、對(duì)稱(chēng)鐘形分布中的,法則,135,1、求是非標(biāo)志(交替標(biāo)志)的標(biāo)準(zhǔn)差,按品質(zhì)標(biāo)志分組且只有兩種表現(xiàn)的標(biāo)志,136,是否是是非標(biāo)志,137,是非標(biāo)志 變量 x 次數(shù) 是 1 否 0 求是非標(biāo)志的平均數(shù)及方差,138,139,140,3、標(biāo)準(zhǔn)化值(數(shù)據(jù)的標(biāo)準(zhǔn)得分,有兩個(gè)班(1、2班)的同一門(mén)課成績(jī),假定兩個(gè)班水平類(lèi)似,但由于兩個(gè)任課老師的評(píng)分標(biāo)準(zhǔn)不同,使得兩個(gè)班成績(jī)的均值和標(biāo)準(zhǔn)
27、差都不同,那么1班得90分的張英和2班得82分的劉抒成績(jī)能否比較,1班均值:78.53,標(biāo)準(zhǔn)差:9.43 2班均值:70.19,標(biāo)準(zhǔn)差:7.0,不能直接比,但可以將它們進(jìn)行標(biāo)準(zhǔn)化后再對(duì)比,141,標(biāo)準(zhǔn)化的方法,劉抒標(biāo)準(zhǔn)得分,張英的標(biāo)準(zhǔn)得分,劉抒的成績(jī)優(yōu)于張英,142,標(biāo)準(zhǔn)化值實(shí)際上是將不同均值和標(biāo)準(zhǔn)差的 總體都轉(zhuǎn)化為均值為0 ,標(biāo)準(zhǔn)差為1 的總體,如:一組數(shù)據(jù):25、28、31、34、37、40、43。試計(jì)算其標(biāo)準(zhǔn)化值,首先計(jì)算出均值為34,標(biāo)準(zhǔn)差為6,143,均值為34,標(biāo)準(zhǔn)差為6,均值為0,標(biāo)準(zhǔn)差為1,標(biāo)準(zhǔn)化后的數(shù)據(jù)雖然均值和標(biāo)準(zhǔn)差發(fā)生了改變 但數(shù)據(jù)內(nèi)部點(diǎn)的相對(duì)位置是沒(méi)有變化的,144,科
28、目 平均分 標(biāo)準(zhǔn)差 甲生 乙生 語(yǔ)文 70 8 91 71 數(shù)學(xué) 56 4 50 64 外語(yǔ) 42 5 40 51 政治 80 10 85 80 物理 50 4 60 70 化學(xué) 40 12 75 45 合計(jì) - - 401 381,原始成績(jī),例:已知某年高考全部考生分科總平均成績(jī)和 標(biāo)準(zhǔn)差值,又知兩名考生的實(shí)際成績(jī)?nèi)缦?計(jì)算兩考生的標(biāo)準(zhǔn)化值,并進(jìn)行比較,145,146,第一、甲考生偏科,數(shù)學(xué)和英語(yǔ)成績(jī)均低于 平均成績(jī);乙考生比較全面,各科成績(jī)都不 低于平均成績(jī),原因,第二、乙考生在平均分偏低且水平差距較?。?biāo)準(zhǔn)差)的物理、數(shù)學(xué)和英語(yǔ)等科目中取得了較好的成績(jī),甲考生則在這些科目上表現(xiàn)不好,影響
29、了其標(biāo)準(zhǔn)成績(jī),147,3、總方差、組間方差和組內(nèi)方差,在總體分組的情況下會(huì)產(chǎn)生上述三種方差 總方差:各標(biāo)志值與總平均數(shù)的離差 組間方差:各組平均數(shù)與總平均數(shù)的離差 組內(nèi)方差:各組組內(nèi)的標(biāo)志值與各組內(nèi)平均數(shù)的離差,三者關(guān)系: 總方差 = 組間方差 + 組內(nèi)方差的算術(shù)平均數(shù),148,其中 i 代表總體內(nèi)的組數(shù),149,150,舉例,某公司7個(gè)門(mén)市部營(yíng)業(yè)額數(shù)據(jù): 88、90、96、98、110、140、200 分成兩組: 88、90、96、98 110、140、200 計(jì)算總方差、組內(nèi)方差和組間方差,151,152,組內(nèi)方差的算術(shù)平均數(shù),153,第三節(jié) 分布形態(tài)的測(cè)定(偏度和峰度,集中趨勢(shì)和離中趨勢(shì)
30、是數(shù)據(jù)分布的兩個(gè)重要 特征。但即使集中趨勢(shì)和離中趨勢(shì)均相同的現(xiàn)象,其分布的形態(tài)也有可能不同,這表明:除了集中趨勢(shì)和離中趨勢(shì)外,分 布還有其他方面的特征:分布的形態(tài),154,反映數(shù)據(jù)分布形狀的指標(biāo)有兩個(gè):偏態(tài)和峰度,偏態(tài):是測(cè)定分布的偏斜方向和偏斜程度的指標(biāo),是相對(duì)于對(duì)稱(chēng)分布而言,峰度:是測(cè)定分布的尖峭程度的指標(biāo),是相對(duì)于正態(tài)分布而言,155,正態(tài)分布,對(duì)稱(chēng)分布,156,首先介紹“矩”的概念,矩:又稱(chēng)動(dòng)差,物理學(xué)上的術(shù)語(yǔ)。統(tǒng)計(jì)上用 來(lái)刻畫(huà)數(shù)據(jù)分布特征的的指標(biāo)的統(tǒng)稱(chēng),K 階矩:所有變量值與數(shù)值a之離差的K 次方 的平均數(shù)稱(chēng)為變量 x 關(guān)于 a 的K 階矩,當(dāng):a等于0時(shí)稱(chēng)為 K 階原點(diǎn)矩 a等于
31、時(shí)稱(chēng)為 K 階原點(diǎn)矩,一階原點(diǎn)階矩就是算術(shù)平均數(shù) 二階中心距就是方差,157,一階原點(diǎn)矩 即為均值,二階中心矩 即為方差,158,1、偏態(tài),偏態(tài):是對(duì)分布的偏斜方向和偏斜程度的測(cè)定,測(cè)定偏態(tài)程度的指標(biāo)稱(chēng)為偏態(tài)系數(shù),如果次數(shù)的分布是完全對(duì)稱(chēng)的,稱(chēng)為對(duì)稱(chēng)分布 否為非對(duì)稱(chēng)分布,即偏態(tài)分布,分左偏和右偏,和 對(duì)稱(chēng)分布比較而言,159,偏態(tài)系數(shù):用三階中心矩定義,該系數(shù)為0時(shí),為對(duì)稱(chēng)分布 大于0時(shí),為右偏態(tài)分布 小于0時(shí),為左偏態(tài)分布 越接近0,偏斜程度就越低,若分布不對(duì)稱(chēng),只有一階中心矩為0,其余的奇數(shù)階中心矩都不為0。若分布對(duì)稱(chēng),所有奇數(shù)階中心矩應(yīng)為0,消除 量綱,160,2、峰度,峰度:是指分布圖
32、形的尖峭程度,和標(biāo)準(zhǔn)正態(tài)分布比較而言的,實(shí)際中,標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)的峰頂為正態(tài)峰, 和標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)相比,陡峭的為尖峰, 平緩的為平峰頂,測(cè)定峰度的指標(biāo)稱(chēng)為 峰度系數(shù),161,峰態(tài),162,峰度系數(shù):用四階中心矩定義。因?yàn)榉植嫉募馇统潭群团紨?shù)階中心矩?cái)?shù)值大小有關(guān),所以該系數(shù)和3比:等于3,為正態(tài)分布; 大于3時(shí),為尖峰分布;小于3時(shí),平峰分布,消除量綱,因?yàn)椋赫龖B(tài)分布曲線(xiàn)的四階中心 矩和標(biāo)準(zhǔn)差的4次方之比為3,163,尖頂分布(K3,平頂分布(K3,正態(tài)分布(K=3,164,因?yàn)閷?duì)于正態(tài)分布,所以,峰度的標(biāo)準(zhǔn)測(cè)定公式為,165,用EXCEL計(jì)算描述統(tǒng)計(jì)量,用EXCEL計(jì)算平均數(shù)、標(biāo)準(zhǔn)差等描述性
33、統(tǒng)計(jì) 量有兩種方法: 一是用函數(shù) 二是用“數(shù)據(jù)分析”工具,166,第一、函數(shù),均值:average 中位數(shù):median 眾數(shù):mode 標(biāo)準(zhǔn)差: 總體標(biāo)準(zhǔn)差:stdevp; 樣本標(biāo)準(zhǔn)差: stdev 分位數(shù):quartile,Excel用于計(jì)算描述統(tǒng)計(jì)量的函數(shù),167,168,分位數(shù)quartile的語(yǔ)法結(jié)構(gòu),Quartile(array, quart,Array:計(jì)算四分?jǐn)?shù)的數(shù)據(jù)區(qū)域。輸入待計(jì)算數(shù)據(jù)的地址即可,Quart:計(jì)算的是第幾個(gè)四分?jǐn)?shù) 可輸入:0、1、2、3、4。分別表示最小值、第1、2、3個(gè)四分位數(shù)和最大值,169,第二、 “數(shù)據(jù)分析”工具,第一次使用“數(shù)據(jù)分析”時(shí),需在EXCE
34、L工具 菜單中選“加載宏”,選“分析工具庫(kù)”。 這樣在“工具”菜單中就會(huì)出現(xiàn)“數(shù)據(jù)分析,170,選擇“網(wǎng)上沖浪”工作表。 打開(kāi)“工具”菜單,選擇“數(shù)據(jù)分析”選項(xiàng),打開(kāi)數(shù)據(jù)分析對(duì)話(huà)框如圖所示,171,雙擊“描述統(tǒng)計(jì)”項(xiàng)或先單擊此項(xiàng)再選擇“確定”按鈕,描述統(tǒng)計(jì)對(duì)話(huà)框打開(kāi)如圖所示。 在“輸入?yún)^(qū)域”中輸入A1:A21,172,由于所選數(shù)據(jù)范圍包括一個(gè)標(biāo)志名稱(chēng),單擊“標(biāo)志位于第一行”選項(xiàng)邊上的復(fù)選框。 單擊“輸出區(qū)域”項(xiàng),旁邊出現(xiàn)了一個(gè)輸入框,單擊此框出現(xiàn)插入符,單擊C1,在輸入框中出現(xiàn)輸出地址“$B$1”,這是輸出結(jié)果的左上角起始位置。 單擊“匯總統(tǒng)計(jì)”,如不選此項(xiàng),則Excel省略部分輸出結(jié)果,173,平均 38.75 標(biāo)準(zhǔn)誤差 2.435348 中位數(shù) 38.5 眾數(shù) 29 標(biāo)準(zhǔn)差 10.89121 方差 118.6184 峰度 -1.0812 偏度 0.277013 區(qū)域 36 最小值 22 最大值 58 求和 775 觀測(cè)數(shù) 20,單擊“確定”按鈕,輸出結(jié)果如下圖所示,174,案例研究“Old Faithful”間歇噴泉的噴發(fā),間歇噴泉是一種向空中噴出熱水和熱氣的溫泉,其名字的由來(lái)是因?yàn)檫@種噴泉要經(jīng)過(guò)一段相對(duì)穩(wěn)定的狀態(tài)后才能?chē)姲l(fā)。有時(shí)它噴射的時(shí)間間隔不太穩(wěn)定。 Ohio(俄亥俄)州
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中標(biāo)格式合同范本
- 省級(jí)課題申報(bào)書(shū)研究手段
- 買(mǎi)貓質(zhì)保合同范本
- 鳳爪貿(mào)易合同范本
- 烹飪課題申報(bào)書(shū)
- 2025生產(chǎn)設(shè)備大數(shù)據(jù)輕量化采集要求
- 單方面解約合同范本
- 產(chǎn)供銷(xiāo)合同范本
- 小學(xué)音樂(lè)類(lèi)課題申報(bào)書(shū)
- 制作公司合同范本
- 接觸隔離標(biāo)準(zhǔn)操作流程
- 港股基礎(chǔ)知識(shí)
- 2025年遼寧醫(yī)藥職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2023-2028年中國(guó)油畫(huà)行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及投資規(guī)劃建議報(bào)告
- 2025年溫州市甌海旅游投資集團(tuán)有限公司下屬子公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025年天津三源電力集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 2025年上半年浙江嘉興桐鄉(xiāng)市水務(wù)集團(tuán)限公司招聘10人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年腹腔穿刺術(shù)課件 (1)2
- (八省聯(lián)考)2025年高考綜合改革適應(yīng)性演練 物理試卷合集(含答案逐題解析)
- 2024年干式電力電容器項(xiàng)目可行性研究報(bào)告
- 河南12系列建筑設(shè)計(jì)圖集一(12YJ1)
評(píng)論
0/150
提交評(píng)論