版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章試驗(yàn)數(shù)據(jù)的整理第四節(jié)基本統(tǒng)計(jì)量第一節(jié)總體和樣本的概念第五節(jié)正態(tài)分布檢驗(yàn)
第二節(jié)試驗(yàn)資料的屬性第三節(jié)次數(shù)分布1、總體(Population)
根據(jù)研究目的確定的,凡是符合指定條件的具有共同性質(zhì)的全部觀察對象稱為總體。例如:(1)要了解中國農(nóng)科院研究生院所有學(xué)生的健康狀況,那么所有研究生院的學(xué)生就構(gòu)成了一個(gè)總體。(2)要了解我們SAS班所有學(xué)生的健康狀況,則所有SAS班的學(xué)生就構(gòu)成了一個(gè)總體。第一節(jié)總體和樣本的概念按總體中的個(gè)體數(shù)目可分為:無限總體有限總體2、個(gè)體構(gòu)成總體的每一個(gè)成員稱個(gè)體。第一節(jié)總體和樣本的概念上例中的中國農(nóng)科院研究生院的每一個(gè)學(xué)生就是這個(gè)總體中的成員,稱為一個(gè)個(gè)體。3、樣本(Sample)從總體中抽取出來進(jìn)行研 究的若干個(gè)體的集合稱為樣本。例:在中國農(nóng)科院研究生院的學(xué)生中隨機(jī)抽取100個(gè)學(xué)生測量健康狀況,那么這100個(gè)學(xué)生就構(gòu)成了一個(gè)樣本。5、觀測值(Observation)每個(gè)個(gè)體的性狀、特性的測定數(shù)值稱觀測值。第一節(jié)總體和樣本的概念例:中的中國農(nóng)科院研究生院的每一個(gè)學(xué)生的身高、體重、血壓等就是一個(gè)觀測值。4、樣本容量樣本中包含的個(gè)體數(shù)量
(樣本含量)樣本的容量越大,越能代表總體。例:上例中的樣本容量為1007、樣本統(tǒng)計(jì)量
根據(jù)樣本觀察值算出的樣本特征數(shù)稱為樣本統(tǒng)計(jì)量。樣本統(tǒng)計(jì)量常用英文字母表示。如:樣本平均數(shù)、樣本標(biāo)準(zhǔn)差S等。6、總體參數(shù)
根據(jù)總體全體觀察值算出的總體特征數(shù)稱為總體參數(shù)。常用希臘字母表示。 如:總體平均數(shù)μ、總體標(biāo)準(zhǔn)差σ等。第一節(jié)總體和樣本的概念第二節(jié)試驗(yàn)資料的屬性一、試驗(yàn)資料的性質(zhì)(可分為兩大類):1、數(shù)量性狀資料(Numeric)
能夠用測量、稱量或計(jì)數(shù)的方法表示的性狀
的資料。(1)連續(xù)型數(shù)量資料(可量資料Interval)通常用稱量、度量或測量的方法得到的
數(shù)據(jù)都可以視為連續(xù)型隨機(jī)變量資料。
它們在某個(gè)區(qū)間內(nèi)是連續(xù)的。例如:體重(公斤)、株高(厘米)、產(chǎn)量(克)、千粒重(克)等。(2)離散型(間斷型)數(shù)量資料(可數(shù)資料Nominal)通常用計(jì)數(shù)方法得到的數(shù)據(jù)。
它們在數(shù)軸上表現(xiàn)為不連續(xù),只能取整數(shù)。第二節(jié)試驗(yàn)資料的屬性例如:發(fā)芽的種子數(shù)、成活的樹苗數(shù)、死亡的
昆蟲頭數(shù)、分蘗數(shù)、穗數(shù)和每穗粒數(shù)等。第二節(jié)試驗(yàn)資料的屬性2、質(zhì)量(屬性)性狀資料(CharacterNominal)
不能直接測量,只能觀測的屬性性狀資料。例如:蟲子的成活與死亡、葉片形狀、花的顏色、小麥的芒性、接種病菌的感染與否等。一、次數(shù)分布表把次數(shù)分布以圖的形式繪出,得次數(shù)分布圖。第三節(jié)次數(shù)分布為了初步研究試驗(yàn)資料的分布規(guī)律性,將眾多的試驗(yàn)資料按類別或區(qū)間進(jìn)行分組,把這些不同類別或各個(gè)區(qū)間出現(xiàn)的個(gè)體頻數(shù)叫次數(shù)分布。把次數(shù)分布以表的形式列出,得次數(shù)分布表。(一)離散性變量資料的整理1、變量可取值個(gè)數(shù)不多時(shí)以自然單位進(jìn)行分組因?yàn)槿≈祩€(gè)數(shù)只有15、16、17、18、19、20六種,所以按自然單位分組。每穗小穗數(shù)(x)次數(shù)(f)1561615173218251917205總次數(shù)(n)100第三節(jié)次數(shù)分布2、若變量可取值個(gè)數(shù)太多,則可按取值大小,從小到大相鄰若干個(gè)值合為一組的方法進(jìn)行整理(一般要求組距相等)。例3.2
調(diào)查200個(gè)稻穗,每穗粒數(shù)資料中,最小的一穗有27粒稻谷,最多的一穗有83粒。利用此數(shù)據(jù)制作次數(shù)分布表。
表3.2200個(gè)稻穗每穗谷粒數(shù)2730……323541……53……………………6783……75第三節(jié)次數(shù)分布1.求極差:2.確定組數(shù):3.確定組距:4.確定組限,制表頭:
步驟如下:5.資料歸組:R=Max(X)-Min(X)=83-27=56組距=極差/組數(shù)=56/12
=4.7≈5本例中擬分12組樣本容量適宜分組數(shù)樣本容量適宜分組數(shù)50—100—200—5~108~1610~20300—500—1000—12~2415~3020~40第三節(jié)次數(shù)分布200個(gè)稻穗每穗粒數(shù)的次數(shù)分布表組限次數(shù)(f)26~30131~35336~401041~452146~503251~5541…………71~75876~80381~852合計(jì)200(二)連續(xù)型變量資料的整理步驟與離散型變量的第二種方法相似。例3.3調(diào)查140行水稻(每行1.33m)的產(chǎn)量(g)數(shù)據(jù)如表3.3所示。利用此數(shù)據(jù)制作次數(shù)分布表。第三節(jié)次數(shù)分布表3.3140行水稻(每行1.33m)的產(chǎn)量(g)177215……104161214……165……………………192231……159R=Max(x)-Min(x)=254-75=179本例中,擬分為12組利用例3.3此數(shù)據(jù)制作次數(shù)分布表。1.求極差:2.確定組數(shù):3.確定組距:4.確定組限,制表頭:步驟如下:5.資料歸組:組距=179÷12=14.9≈15注:以最小值做第一組的組中值,可以多出半組,所以最終往往多出1組。第三節(jié)次數(shù)分布(三)屬性變量資料的整理按屬性類別分組:第三節(jié)次數(shù)分布1.直方圖2.條形圖3.餅圖第三節(jié)次數(shù)分布二、次數(shù)分布圖1.直方圖第三節(jié)次數(shù)分布適用于表示連續(xù)型變量的次數(shù)分布以表3.3的數(shù)據(jù)分布為例說明。2.條形圖第三節(jié)次數(shù)分布適用于表示離散性和屬性變量的資料以表3.2的數(shù)據(jù)分布為例說明。3.餅圖適用于表示間斷性和屬性變量的資料第三節(jié)次數(shù)分布以表3.4的數(shù)據(jù)分布為例說明。第四節(jié)基本統(tǒng)計(jì)量樣本基本統(tǒng)計(jì)量主要有:一、平均數(shù)類:(表征中心位置)算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)等。二、變異數(shù)類:(表征變異程度)極差、樣本標(biāo)準(zhǔn)差、樣本方差、樣本平均數(shù)標(biāo)準(zhǔn)差(即標(biāo)準(zhǔn)誤)樣本變異系數(shù)等。第四節(jié)基本統(tǒng)計(jì)量一、平均數(shù)類:
1、平均數(shù)的意義和種類
平均數(shù)的意義:(1)用于表示變數(shù)的集中趨勢,指示資料的中心位置,反映資料的一般質(zhì)量水平。(2)作為一組數(shù)據(jù)的代表值與其它數(shù)據(jù)作比較。第四節(jié)基本統(tǒng)計(jì)量1、算術(shù)平均數(shù)(Mean)
所有資料觀察值的總和除以觀察值個(gè)數(shù)所得的商。有極端值時(shí)不夠穩(wěn)健。平均數(shù)的種類:2、中位數(shù)(Median)
將資料所有觀察值排序后,居于中間位置
的那個(gè)觀察值(當(dāng)觀察值數(shù)目為偶數(shù)時(shí),居于中間位置的那兩個(gè)觀察值的平均數(shù))。3、眾數(shù)(mode)
資料中最常見的一數(shù),或次數(shù)分布表中次數(shù)最多的那組的組中值。例1:2,4,6,5,9,5,4,5,1,10,3眾數(shù)是5例2:小麥小穗數(shù)眾數(shù)是17每穗小穗數(shù)(x)次數(shù)(f)1561615173218251917205總次數(shù)(n)100第四節(jié)基本統(tǒng)計(jì)量第四節(jié)基本統(tǒng)計(jì)量4、平均數(shù)的計(jì)算1、總體平均數(shù)(populationmean):第四節(jié)基本統(tǒng)計(jì)量2、樣本平均數(shù)(Samplemean):5、算術(shù)平均數(shù)的局限性
平均數(shù)有時(shí)其代表性很差。例如下面的兩組人,平均年齡都是25歲,能說這兩組人的年齡是一樣嗎?24歲26歲25歲25歲49歲1歲第四節(jié)基本統(tǒng)計(jì)量第四節(jié)基本統(tǒng)計(jì)量
由此可見:樣本變異大,平均數(shù)的代表性就差;樣本變異小,平均數(shù)的代表性就較好。因此,需要引進(jìn)一個(gè)新的統(tǒng)計(jì)量來反映資料的變異程度。第四節(jié)基本統(tǒng)計(jì)量1、極差(全距,Range)
一組數(shù)據(jù)的最大值與最小值之差。即:R=Max(x)-Min(x)上例中:第一組數(shù)據(jù)的極差為:R1=26-24=2第二組數(shù)據(jù)的極差為:R2=49-1=48可見第二組人的年齡變異大的多。二、變異數(shù)類:2、方差(Variance)
又稱均方(MeanSquare)
其功用是反映資料的離散變異程度??傮w方差σ2樣本方差S
2第四節(jié)基本統(tǒng)計(jì)量1)總體方差計(jì)算第四節(jié)基本統(tǒng)計(jì)量2)樣本方差計(jì)算第四節(jié)基本統(tǒng)計(jì)量第四節(jié)基本統(tǒng)計(jì)量方差計(jì)算
五株水稻的單株粒重為:2,8,7,5,4(克)單株粒重28754-3.22.81.8-0.2-1.110.247.843.240.041.44總和26022.80平均5.23、標(biāo)準(zhǔn)差(StandardDeviation)
其功用是反映資料的離散變異程度,它是方差的正平方根值,其度量單位與觀察值相同。第四節(jié)基本統(tǒng)計(jì)量總體標(biāo)準(zhǔn)差σ(PopulationSD):樣本標(biāo)準(zhǔn)差S(SampleSD):
a、總體標(biāo)準(zhǔn)差的計(jì)算:b、樣本標(biāo)準(zhǔn)差的計(jì)算:第四節(jié)基本統(tǒng)計(jì)量4、標(biāo)準(zhǔn)誤(StdError,StdMean)樣本平均數(shù)的標(biāo)準(zhǔn)(誤)差,反應(yīng)樣本平均數(shù)的變異程度,即抽樣誤差的大小。實(shí)質(zhì)上是樣本平均數(shù)構(gòu)成的樣本的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤較小表示樣本均數(shù)與總體均數(shù)比較接近,為了保證樣本代表總體比較可靠,就得適當(dāng)增大樣本含量。第四節(jié)基本統(tǒng)計(jì)量5、變異系數(shù)(CoefficientofVariation)
在比較兩組平均數(shù)相差很大或數(shù)據(jù)單位不同的資料的變異程度時(shí),則需要用到變異系數(shù)的概念。記為(
CV
),是指資料的標(biāo)準(zhǔn)差與平均數(shù)之比。第四節(jié)基本統(tǒng)計(jì)量
平均數(shù)相差很大的例子:甲測量排球場長度三次,得乙測量足球場長度三次,得
第四節(jié)基本統(tǒng)計(jì)量
雖然兩組數(shù)據(jù)的s
都等于1,但不能認(rèn)為兩組數(shù)據(jù)的變異程度相同。乙測量得顯然比甲精確。2、矯正平方和(CSS)三、其它統(tǒng)計(jì)量1、未矯正平方和(USS)第四節(jié)基本統(tǒng)計(jì)量3、偏度(Skewness)第四節(jié)基本統(tǒng)計(jì)量考察資料的左右對稱性的分布情況:
Sk
=0對稱分布
Sk
>0右(正)偏分布,向右側(cè)分散更遠(yuǎn)
Sk
<0左(負(fù))偏分布,向左側(cè)分散更遠(yuǎn)第四節(jié)基本統(tǒng)計(jì)量4、峰度(Kurtosis)以正態(tài)分布為標(biāo)準(zhǔn)考察資料陡峭分布的情況:
Ku
=0數(shù)據(jù)正態(tài)分布
Ku
>0數(shù)據(jù)尖峰分布,向中間集中
Ku
<0數(shù)據(jù)扁平分布,含有較多極端值5、百分位數(shù)(Percentile)第四節(jié)基本統(tǒng)計(jì)量是中位數(shù)的推廣,n個(gè)數(shù)據(jù)排序后,處于p%位置的值xp稱為第p百分位數(shù),表示有p%的數(shù)不超過這個(gè)值。當(dāng)np/100是整數(shù)當(dāng)np/100不是整數(shù)其中,i=[np/100],即np/100取整分位數(shù)的一些概念第四節(jié)基本統(tǒng)計(jì)量中位數(shù)即是第50百分位數(shù)最小值即是第0百分位數(shù)最大值即是第100百分位數(shù)下四分位數(shù)即是第25百分位數(shù),記為Q1上四分位數(shù)即是第75百分位數(shù),記為Q3四分位極差為上四分位數(shù)與下四分位數(shù)的差 值,即Q3-Q1第五節(jié)正態(tài)分布檢驗(yàn)檢驗(yàn)數(shù)據(jù)資料是否服從正態(tài)分布。正態(tài)分布檢驗(yàn)有多種方法:1)偏度、峰度、Q-Q圖、正態(tài)概率紙檢驗(yàn)2)卡方擬合優(yōu)度檢驗(yàn)3)Shapiro-Wilk檢驗(yàn)4)經(jīng)驗(yàn)分布擬合優(yōu)度檢驗(yàn)1、正態(tài)分布檢驗(yàn)第五節(jié)正態(tài)分布檢驗(yàn)1)偏度、峰度、Q-Q圖、正態(tài)概率紙檢驗(yàn)比較直觀,但有些粗略。2)卡方擬合優(yōu)度檢驗(yàn)分組不同,擬合的結(jié)果可能不同。需要有足夠大的樣本含量。對于連續(xù)型變量的優(yōu)度擬合,卡方檢驗(yàn)并不是理想的方法。將數(shù)據(jù)排序后一分為二折返配對,計(jì)算差值,查系數(shù)表ak(n),構(gòu)造W統(tǒng)計(jì)量。Shapiro-WilkW
統(tǒng)計(jì)量2、Shapiro-Wilk檢驗(yàn)法(小樣本8≤n≤50)第五節(jié)正態(tài)分布檢驗(yàn)統(tǒng)計(jì)量W的取值范圍為[0,1]在原假設(shè)H0:數(shù)據(jù)服從正態(tài)分布下,統(tǒng)計(jì)量W應(yīng)該接近于1,反之應(yīng)接近于0,在給定顯著性水平α下,使得:第五節(jié)正態(tài)分布檢驗(yàn)其拒絕域?yàn)椋?、S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育科技在家居環(huán)境中的應(yīng)用與推廣
- 數(shù)據(jù)驅(qū)動(dòng)的企業(yè)產(chǎn)品研發(fā)實(shí)驗(yàn)決策
- 個(gè)人間2024年無償借款合同書一
- 2025年度離婚協(xié)議書附財(cái)產(chǎn)清算與債務(wù)處理規(guī)范文本3篇
- 智慧校園建設(shè)中的教學(xué)資源共享策略研究
- 學(xué)生足球基本技巧與教學(xué)策略
- 二零二五版臨設(shè)工程設(shè)計(jì)與轉(zhuǎn)讓技術(shù)支持協(xié)議4篇
- 二零二五版旅游觀光景區(qū)門票銷售合同4篇
- 2025版臨建場地設(shè)施設(shè)備拆除與回收利用合同4篇
- 二零二五年度門面房買賣合同附贈(zèng)周邊商業(yè)配套使用協(xié)議4篇
- 社區(qū)醫(yī)療抗菌藥物分級管理方案
- 《醫(yī)院標(biāo)識牌規(guī)劃設(shè)計(jì)方案》
- 夜市運(yùn)營投標(biāo)方案(技術(shù)方案)
- 公眾號運(yùn)營實(shí)戰(zhàn)手冊
- 2024中考地理必考試卷含解析
- (高清版)DZT 0282-2015 水文地質(zhì)調(diào)查規(guī)范(1:50000)
- 《紅樓夢》禮儀研究
- 會(huì)議分組討論主持詞
- 動(dòng)火作業(yè)審批表
- 新能源汽車火災(zāi)事故處置程序及方法
- 教學(xué)查房及體格檢查評分標(biāo)準(zhǔn)
評論
0/150
提交評論