版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第 3 章平均數(shù)、標準差與變異系數(shù) 數(shù)據(jù)有兩種變化趨勢:集中趨勢和離散趨勢。 表示數(shù)據(jù)集中趨勢的指標有多個,如平均數(shù)(算術平均數(shù)、幾何平均數(shù))、中位數(shù)、眾數(shù),使用最多的是算術平均數(shù)。 表示數(shù)據(jù)離散趨勢的指標有多個,如極差、平均離差、方差與標準差,使用最多的是方差與標準差。 資料中各觀察值的總和除以觀察值的個數(shù)所得的商,稱為算術平均數(shù)算術平均數(shù),簡稱為平均平均數(shù)或均數(shù)。數(shù)或均數(shù)。用符號 表示。 平均數(shù)的意義:平均數(shù)的意義: 平均數(shù)用來描述資料的集中性,即指出資料中數(shù)據(jù)集中較多的中心位置,常用于同類性質(zhì)資料間的相互比較。x一、集中趨勢計算方法計算方法1. 直接法直接法 適用于樣本含量較小的非頻數(shù)資
2、料 如果一個含量為n的樣本,其n個觀察值分別用x1、x2xn表示,則它們的平均數(shù)為 其中,(Sigma)為總和符號, 表示從第一個觀察值x1累加到第n個觀察值xn,若在意義上已明確時,簡記為x。121ninixxxxxnnniix1常數(shù)的總和等于該常數(shù)的n倍,即代數(shù)和的總和等于總和的代數(shù)和,即總和符號內(nèi)的常數(shù)因子可以提取到總和符號之外,即其中C為常數(shù)(a為常數(shù))ninCC1iiiiiizyxzyx)(njkiijkinjijxx1111iixaaxkkkfffxfxfxfx2122112. 加權法加權法 如果樣本中有n1個x1,有n2個x2,那么,n1+n2個數(shù)的平均數(shù)是加權平均數(shù)。 同理:
3、各組的次數(shù) fi 是權衡各組中值 xi在資料中所占比重大小的數(shù)量,因此f被稱為是x的“權”,加權法也由此而得名。212211nnxnxnxffxfxfkiikiii11 在計算離散型頻數(shù)資料的平均數(shù)時, 式中x為組值,f為頻數(shù),N為總頻數(shù)(f),k為組數(shù)。Nfxxkii1)( 表表3-13-15050只小雞出殼天數(shù)的頻數(shù)分布表只小雞出殼天數(shù)的頻數(shù)分布表10915021.82fxxf 在計算連續(xù)型頻數(shù)資料的平均數(shù)時, 式中m為組中值,f、N和k同上式。Nfmxkii1)(組 別組中值m頻數(shù)(f)fm44.2545.029045.7546.529347.2548.01048048.7549.512
4、59450.2551.026132651.7552.544231053.2554.043232254.7555.5291609.556.2557.01162757.7558.515877.559.2560.0212060.7561.54246合計20010695表3-2 某純系蛋雞200枚蛋重的頻數(shù)分布表 =10695/200 =53.475x平均數(shù)有以下幾個基本特性: (1)平均數(shù)的計算與樣本內(nèi)每個值都有關,它的大小受每個值的影響。 (2)若每個xi都乘以相同的數(shù)k,則平均數(shù)亦應乘以k。 (3)若每個xi都加上(或減去)相同的數(shù)A,則平均數(shù)亦應加上(或減去) A。 將資料中所有觀察值從小到大
5、依次排列,處于中間位置的數(shù)。以Md表示。 適用條件適用條件 資料呈偏態(tài)分布偏態(tài)分布或頻數(shù)分布類頻數(shù)分布類型不明型不明,以及一端或兩端無確定數(shù)值一端或兩端無確定數(shù)值,這種資料用中位數(shù)作為代表值比用算術平均數(shù)為好。 非頻數(shù)資料,先將各觀察值由小到大排資料,先將各觀察值由小到大排列,列,當n為奇數(shù)時,第(n+1)/2位置的觀察值即為中位數(shù),即: Md =x (n+1)/2其中:L中位數(shù)所在組的下限;i組距;f中位數(shù)所在組的頻數(shù);n總頻數(shù);c小于中數(shù)所在組的累積頻數(shù)。/2 1n 2 / n2) 12 /(2 /nndxxM)2(cnfiLMd當n為偶數(shù)時, 和 位置的兩個觀察值之和的二分之一即為中位數(shù)
6、,即: 若資料已分組,并編制成了頻數(shù)分布表,可利用頻數(shù)若資料已分組,并編制成了頻數(shù)分布表,可利用頻數(shù)分布表計算中數(shù)。分布表計算中數(shù)。潛伏期(小時)潛伏期(小時)病例數(shù)病例數(shù)f 累計例數(shù)累計例數(shù)02525125883244012336231464812158605163721164)(8 .23)252164(581212)2(25,58,12,164,12小時此例cnfiLMCfLnid例某地區(qū)有164人因沙門氏菌食物中毒,其潛伏期資料經(jīng)整理如下表,試計算中位數(shù)。 資料中出現(xiàn)次數(shù)最多的那個數(shù)或頻數(shù)最多一組的組中值,記為Mo。 fmax=24, Mo=22 50 50只小雞出殼天數(shù)的頻數(shù)分布表只
7、小雞出殼天數(shù)的頻數(shù)分布表10915021.82fxxfMd=22組 別組中值m頻數(shù)(f)fx44.2545.029045.7546.529347.2548.01048048.7549.51259450.2551.026132651.7552.544231053.2554.043232254.7555.5291609.556.2557.01162757.7558.515877.559.2560.0212060.7561.54246合計20010695表3-2 某純系蛋雞200枚蛋重的頻數(shù)分布表 =10695/200 =53.475xfmax=44, Mo=52.5Md=53.35 定義定義 指n
8、個觀察值乘積的n次方根。即 適用條件適用條件 主要應用于數(shù)據(jù)呈倍數(shù)關系呈倍數(shù)關系或不對稱分布不對稱分布的資料,算術平均數(shù)對這類資料的代表性差算術平均數(shù)對這類資料的代表性差。如抗體效價(1:10,1:100,1:1000,1:10000)、增長率或生長率、動態(tài)發(fā)展速度等。nnnnxxxxxxG1).(.2121計算計算1 1、應用公式計算(實際應用時常取對數(shù))、應用公式計算(實際應用時常取對數(shù))nnxxxG.21niinxnxxxnG121lg1lglglg1lgniixnG11lg1lg 例 海蝦養(yǎng)殖試驗,各旬的生長速度3.0,1.5 1.3,1.2,1.2,1.1,1.1,求海蝦的旬平均生長
9、速度。 解: 即海蝦平均生長速度為1.38。 其算術平均數(shù)為14. 01 . 1lg22 . 1lg25 . 1lg3lg71lgG38. 114. 0lg1G121.48nxxxxn 當資料編成頻數(shù)分布表時當資料編成頻數(shù)分布表時, 各組組中值; 各組次數(shù);)lg(lg1fxfGiixif 資料的另一方面的特征是變異程度。如: A 組資料: 3 、 4 、 5 、 6 、 7 平均數(shù)為: 5 B 組資料: 1 、 3 、 5 、 7 、 9 平均數(shù)為: 5 這里的平均數(shù) 5 對于 A 組資料的代表性好?還是對于 B 組資料的代 表性好?可見,只表明了數(shù)據(jù)的集中程度是遠遠不夠的,還需要進一步說明
10、數(shù)據(jù)的變異程度。只有通過變異程度的描述,才知道代表值的代表性。表示數(shù)據(jù)變異特征的數(shù)值叫變異數(shù)變異數(shù)。常用的變異數(shù)有:極差、平均離差、方 差、標準差、變異系數(shù)等。 極差(全距)極差(全距) 極差 = 最大值 - 最小值 只利用了資料中最大值和最小值,不能準確表達資料中各個觀察值的變異程度。 平均離差平均離差 1xxdn它不能表示整個資料中所有觀察值的總偏離程度使用不方便,在統(tǒng)計學中未被采用消除離均差的負號離均差的平方之和(簡稱平方和平方和,記為SS)稱為均方均方(縮寫為MS),又稱為樣本樣本方差方差,記為S2標準差標準差S S)(xx0)(xxxx)(xx2)(xx2)(xx) 1/()(2nx
11、x) 1/()(2nxxS離均差離均差 首先求出離均差,即每個數(shù)與它們的平均數(shù)之間的離差;然后將所有的離均差平方,再相加,得出離均差平方和;最后用n-1除離均差平方和(按照統(tǒng)計學理論,不要用樣本含量n去除),所得的商稱為樣本方差,用符號s2表示。 方差s2是離均差平方的平均數(shù)。雖然方差在實際應用中用得最廣泛,但因它的單位是原始數(shù)據(jù)單位的平方,所以它不能直接地指出某個數(shù)x與平均數(shù)之間的偏離究竟達到什么程度。為此,采用標準差s做標準,衡量x與平均數(shù)之間的離散程度。 自由度 (degree of freedom) :統(tǒng)計學借此來反映一批變量的約束條件。 例如一個有 5 個觀察值的樣本,因為受到統(tǒng)計數(shù)
12、的約束,在5個離均差中,只有4個數(shù)值可以在一定范圍內(nèi)自由變動取值,而第五個離均差必須滿足這一限制條件。 自由度記作 DF , 一般樣本自由度等于觀察值個數(shù) ( n ) 減去約束條件的個數(shù) ( k ) ,即 DF n k 。 1)(122nxxsnii1)(12nxxsnii樣本方差樣本標準差 為了方便計算,將離均差平方和轉(zhuǎn)化為另一種形式,同時略去下標,上式可表示為:1)(22nnxxs 在計算離散型頻數(shù)資料的標準差時, 式中x為組值,f為頻數(shù),N為總頻數(shù)(f),k為組數(shù)。1)(22NNfxfxs 在計算連續(xù)型頻數(shù)資料的標準差時, 式中m為組中值,f、N和k同上式。1)(22NNfmfms標準差的特性標準差的特性(一)標準差的大小受資料中各觀察值的影響,觀察值間變異大的標準差也大,反之則??;(二)計算標準差時,各觀測值加上或減去一個常計算標準差時,各觀測值加上或減去一個常數(shù),標準差的值不變數(shù),標準差的值不變; (三)當每個觀察值都乘以一個常數(shù)a時,所得的標準差是原來標準差的a倍樣本的方差為總體的方差為 資料的單位不同或平均數(shù)相差很大時,直接利用標準差比較資料間變異程度是不妥的,需用變異系數(shù)。 變異系數(shù)同標準差一樣是衡量資料變異程度的統(tǒng)計量。變異系數(shù)消除了不同單位和平均數(shù)的影響,可以用來比較不同資料的相對變異程度。 變異系數(shù)是標準差與平均數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《食品安全信息報告》課件
- 合伙合同糾紛權威訴訟策略
- 《民用建筑構造概述》課件
- 2025年阿里貨運從業(yè)資格證考試一共多少題
- 2025年臨汾客貨運從業(yè)資格證考試教材
- 2025年廣州道路運輸從業(yè)資格證考試題和答案
- 2025年興安貨運上崗證模擬考試0題
- 《型曲面積分的計算》課件
- 第一單元 中國開始淪為半殖民地半封建社會 同步練習 部編版八年級歷史上冊
- 鋁單板商業(yè)步行街施工合同
- 中國地質(zhì)大學(武漢)《自然語言處理》2022-2023學年第一學期期末試卷
- 【物理】2024-2025學年人教版物理八年級上冊 期末復習計算題
- 【MOOC】學術交流英語-東南大學 中國大學慕課MOOC答案
- 家用剪刀市場發(fā)展現(xiàn)狀調(diào)查及供需格局分析預測報告
- 部編版(2024版)七年級地理上冊第六章《跨學科主題學習-探索外來食料作物傳播史》教學課件
- 《世說新語》整本書閱讀導讀
- 大學生防艾健康教育學習通超星期末考試答案章節(jié)答案2024年
- 分子生物學習題答案
- 《機械制圖》復習題庫及答案2
- 中國人民解放軍空成立紀念日課件模板
- 工商企業(yè)管理畢業(yè)論文范文(4篇)
評論
0/150
提交評論