版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據的基本分析數據特征值的計算第1頁,共26頁,2023年,2月20日,星期六本章提要算術平均數和幾何平均數的計算算術平均數的性質極差、方差和標準差的計算方差與標準差之間的關系標準差的性質第2頁,共26頁,2023年,2月20日,星期六第一節(jié)平均值——數據集中性第3頁,共26頁,2023年,2月20日,星期六平均值的計算平均值(mean、average)——觀測值的平均水平和集中趨勢的表示常用的平均值有:
算術平均數
幾何平均數
調和平均數
眾數
中位數
百分位數在本專業(yè)的統(tǒng)計和日常工作中,以算術平均值和幾何平均值最為常見,使用最頻繁調和平均數一般用在速度類問題方面眾數、中位數由于計算工具的改進已用得不多第4頁,共26頁,2023年,2月20日,星期六算術平均數(arithmeticmean)是最常用的平均值,簡稱為平均值,或均值算術平均數有兩種計算方法:
1、直接法
2、加權法在次數分布表或資料分類的基礎上進行計算,用加權法計算得的算術平均值稱加權平均值(weightedmean)或:第5頁,共26頁,2023年,2月20日,星期六加權法第二式中的是頻數:而加權平均值用表示,在很多情況下,與算術平均值不一定相等,特別是當我們用組距式分組法中每一組的組中值作為每一組的組平均值時更是如此直接法所得到的平均值有兩個基本性質:1、離均差之和為零,用公式表示,即2、離均差平方和為最小,即其中,為不等于的任意一個數:
第6頁,共26頁,2023年,2月20日,星期六用直接法所得到的算術平均值的這兩個基本性質很重要,同學們可以自己加以證明需要指出的是,加權平均值不具有這兩個基本性質(因此,一般不計算加權平均值)對于總體來說,我們通常用表示其平均數當總體為有限,且總體容量為時,總體平均值的計算公式為:但一般情況下,總體平均值總是未知的,需要用樣本平均值來進行估計,因此,樣本的代表性就顯得尤為重要第7頁,共26頁,2023年,2月20日,星期六幾何平均值(geometricmean)主要用于非線性數據的統(tǒng)計分析,如增長率、疫病的潛伏期、藥物效價、抗體滴度等的平均值幾何平均值用表示:在實際計算時可將其轉換為對數形式進行計算:分組資料幾何平均值的計算公式為:第8頁,共26頁,2023年,2月20日,星期六算術平均數一般用在加性(additive)資料、或稱線性(linear)資料中所謂加性資料或線性資料是指這些資料是可加的,或每一個數據可分解成若干個可加的部分,如人體和動物體的身高、體重等外形性狀,人類和家畜的生理、生化數值等,這些資料一般服從或近似服從正態(tài)分布幾何平均數一般用在非加性(non-additive)或非線性(non-linear)資料中,如平均增長率、藥物或疫苗的平均效價、抗體滴度等第9頁,共26頁,2023年,2月20日,星期六調和平均值(harmonicmean)一般用在平均速度、“有效群體”等方面,其公式為:第10頁,共26頁,2023年,2月20日,星期六第二節(jié)變異數——數據離散性第11頁,共26頁,2023年,2月20日,星期六變異數的計算變異數(variable)——觀測值離散程度的表示,用來表示平均值代表性的強弱變異數大,說明數據離散程度大,平均值的代表性差;反之,變異數小,說明數據離散程度小,平均值的代表性好因此,僅用一個平均值作為資料特征值進行統(tǒng)計描述是不夠的,還需要有表示數據離散程度描述的統(tǒng)計量常用來表示數據離散性的變異數有以下幾個:
極差
方差
標準差第12頁,共26頁,2023年,2月20日,星期六極差(rangeR
)將資料中的最大值數據減去最小值數據,即為極差顯然,一批數據不管其樣本量有多大,計算極差總是只用兩個值,一個最大值,一個最小值,其余數據都沒有用上,因此這是不合理的,也沒有統(tǒng)計學意義,樣本與樣本的離散程度也無法進行比較,如以下兩個樣本:23,25,26,31,45,47,48
其極差為2523,32,32,34,36,36,48
其極差為25第13頁,共26頁,2023年,2月20日,星期六顯然第一個樣本的離散程度比第二個樣本要來得大,但僅從極差上是看不出來的,因為兩個樣本的極差都等于25第14頁,共26頁,2023年,2月20日,星期六方差(varianceV
s2
)合理的方法應當使某一個數據都參與到計算離差的過程中去,將某一個數據均與平均值相比較,即某一個數據均與平均值相減顯然有多少個數據,就有多少個差值,且這些差值之和必為0(算術平均數的第一個性質)將這些差值平方以后再相加,得到一個值這個值不會等于
0,且由于各個差值都平方了,其中離平均值較遠的數值在表現離差時的作用更明顯了第15頁,共26頁,2023年,2月20日,星期六但由于每個樣本在很多情況下不會一樣大,因此應將這一平方和(SS)平均一下,以利于比較如上例的兩批數據:23,25,26,31,45,47,48
其平均值為35離均差平方和為SS=754,用自由度平均一下,得125.66723,32,34,34,37,37,48
其平均值為35離均差平方和為SS=332,用自由度平均一下,得55.333顯然第二個樣本較第一個樣本要集中一些第16頁,共26頁,2023年,2月20日,星期六125.667為第一個樣本的方差值(S2)
55.333為第二個樣本的方差值(S2)方差值是平方以后的值,因此使用中不太方便第17頁,共26頁,2023年,2月20日,星期六標準差(standarddeviation)將方差開一下平方根,得上例中,第一個樣本的標準差為
11.21
第二個樣本的標準差為7.44標準差由于已經過了開平方,其單位與平均數是一致的,因此標準差是統(tǒng)計學中經常使用的一個值得到平均值和標準差后,這批數據可以用下式來表示:總體:樣本:是參數是統(tǒng)計量第18頁,共26頁,2023年,2月20日,星期六標準差的計算公式總體標準差:樣本標準差:上面兩個式子中,每一個公式的后面部分是如何從前面部分變來的,請同學們作為作業(yè)自行推導比較兩個公式的不同,我們會發(fā)現:總體標準差用總體含量N
來得到,而樣本標準差則用n-1
來得到第19頁,共26頁,2023年,2月20日,星期六n-1
在這里稱為自由度(degreeoffreedomdf)自由度的含義和說明對于樣本容量為n
的樣本來說,每一個觀測值都有一個離均差,即
n個離均差,由于受的限制,只有n-1個離均差是自由的,有一個離均差失去了自由在統(tǒng)計學中,若某個統(tǒng)計量的計算受到
k個條件的限制,則其自由度就為
n-k,在估計樣本方差時受到了平均數的限制,因此樣本方差的自由度就是
n-1;估計平均數時沒有限制條件,因此平均數的自由度就是
n第20頁,共26頁,2023年,2月20日,星期六樣本方差有一個十分重要的作用,就是用來估計總體方差由于,根據平均數的第二個性質可知,必小于,因此如用必定偏小將分母改為
n-1,則可適當增大值,使樣本方差的數學期望更接近于總體方差因此使用自由度的目的就是為了能用樣本方差更好地、無偏(unbias)地估計總體方差第21頁,共26頁,2023年,2月20日,星期六小樣本資料必須用n-1來計算方差,即標準差,大樣本時n與
n-1相差無幾,因此大樣本時也可用n代替n-1由于大小樣本的界限沒有嚴格的規(guī)定,因此在一般狀況下仍宜使用n-1在一般情況下,樣本方差通常也稱為均方(Meanofsquare),用或表示之加權平均數的標準差公式:第22頁,共26頁,2023年,2月20日,星期六有了平均數和標準差,我們就可以用一個比較簡單的方法來表示一個樣本或一批資料:標準差的特性變量越離散,標準差越大;反之,標準差越大,表示數據越離散,資料的變異程度越大各變量加減一個常數,標準差不變各變量乘一個常數a,標準差將擴大a
倍第23頁,共26頁,2023年,2月20日,星期六資料服從正態(tài)分布時,觀測值的分布為:68.27%的數據分布在的范圍內95.45%的數據分布在的范圍內99.73%的數據分布在的范圍內另外還有兩個十分重要的分布范圍:內包含了95%的變量內包含了99%的變量第24頁,共26頁,2023年,2月20日,星期六變異系數(coefficientofvariationc.v.)不同單位的資料很難比較其變異程度,因此應將標準差相對化,變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年新科版選修4歷史上冊階段測試試卷含答案
- 2025年度共享辦公空間租賃協議延期及使用權轉讓合同4篇
- 按揭二手車轉讓合同(2篇)
- 二零二五年度新能源汽車電池回收利用合同集錦2篇
- 二零二五年度企業(yè)并購財務盡職調查合同3篇
- 二零二五年度農家樂鄉(xiāng)村旅游資源整合開發(fā)合同4篇
- 二零二五年度紡織機械設備租賃合同范本4篇
- 2025年度納稅擔保稅務風險控制合同
- 2025年苗木種植與生態(tài)農業(yè)循環(huán)經濟合作合同4篇
- 2025年度綠色建筑認證結算工程款合同樣本2篇
- 【寒假預習】專題04 閱讀理解 20篇 集訓-2025年人教版(PEP)六年級英語下冊寒假提前學(含答案)
- 2024年智能監(jiān)獄安防監(jiān)控工程合同3篇
- 2024年度窯爐施工協議詳例細則版B版
- 幼兒園籃球課培訓
- 【企業(yè)盈利能力探析的國內外文獻綜述2400字】
- 統(tǒng)編版(2024新版)七年級《道德與法治》上冊第一單元《少年有夢》單元測試卷(含答案)
- 100道20以內的口算題共20份
- 高三完形填空專項訓練單選(部分答案)
- 護理查房高鉀血癥
- 項目監(jiān)理策劃方案匯報
- 《職業(yè)培訓師的培訓》課件
評論
0/150
提交評論