第三章次數(shù)分布和平均數(shù)、變異數(shù)_第1頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第2頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第3頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第4頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章次數(shù)分布和平均數(shù)、變異數(shù)試驗資料的性質次數(shù)分布資料的特征數(shù)第一節(jié)總體及其樣本一、幾個常用的統(tǒng)計術語1、總體與樣本由試驗研究的目的而確定的同類事物或現(xiàn)象的全體稱為總體(population)。從總體中抽取一部分個體作為總體的代表來研究。被抽取的這些個體稱為樣本(sample).

樣本容量;非隨機樣本(non-randomsample)。隨機樣本(randomsample);大樣本與小樣本;總體與樣本的關系

由樣本推斷總體雖然有很大可靠性,也有一定錯誤率。俗語說“不可不信,不可全信”,這是我們對待統(tǒng)計推斷的正確態(tài)度。2、參數(shù)與統(tǒng)計數(shù)如:總體平均數(shù)----總體方差----μ用總體的全體觀察值計算的、描述總體的特征數(shù)稱為參數(shù)(parameter)。如:樣本平均數(shù)----樣本均方----

由樣本的全體觀察值計算的、描述樣本的特征數(shù)稱為統(tǒng)計數(shù)(statistics)。統(tǒng)計上,通常由樣本統(tǒng)計數(shù)估計或推斷總體相應參數(shù)。第二節(jié)次數(shù)分布當觀測值不多(n≤30)時,不必分組,直接進行統(tǒng)計分析。當觀測值較多(n>30)時,宜將觀測值分成若干組,以便統(tǒng)計分析。將觀測值分組后,制成次數(shù)分布表,即可看到資料的集中和變異情況。一、試驗資料的分類1、數(shù)量性狀資料

凡是能夠以量測或計數(shù)的方法表示其特征的性狀統(tǒng)稱為數(shù)量性狀。

觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料。

它的各個觀察值須以整數(shù)表示,兩個相鄰整數(shù)間不容許任何帶有小數(shù)的值存在。因此,該類資料也稱非連續(xù)性或間斷性變數(shù)資料。(1)計數(shù)資料

指用計數(shù)方式得到的數(shù)據(jù)資料.

各個觀察值不一定是整數(shù),兩個相鄰的整數(shù)間可有帶小數(shù)的任何數(shù)值出現(xiàn);計量資料也稱之為連續(xù)性變數(shù)資料.(2)計量資料凡用稱量、測量等量測手段得到的數(shù)量性狀資料。

質量性狀是指只能觀察而不能測量的性狀。如花藥、莖、種子、果實、葉片的顏色、籽粒的飽滿度、芒的有無等。

2、質量性狀資料質量性狀本身不能用數(shù)值表示,要獲得這類性狀的資料,須對其觀察結果作數(shù)量化處理。數(shù)量化方法可分為以下兩種:

在一個樣本內,分別統(tǒng)計具有某種性狀、不具有該性狀的個體數(shù),這種數(shù)量化的資料又叫次數(shù)資料。

(1)統(tǒng)計次數(shù)法先根據(jù)性狀的變異情況分級,給每級分別賦予一個適當?shù)臄?shù)值作代表值,然后統(tǒng)計樣本中屬于各個級別的個體數(shù)。(2)分級法(給分法)二、次數(shù)分布(一)計量資料次數(shù)分布表制作1.求極差RR=max{yi}-min{yi}本例:R=73.7-47.9=25.8(kg)極差(range)為資料中的最大觀察值與最小觀察值的差數(shù),它表示了整個樣本的變異幅度.2.確定組數(shù)與組距確定適當?shù)慕M數(shù),應考慮:觀察值個數(shù)的多少;極差(R)的大??;便于計算;能反映出資料的真實面貌。

組距是每個組區(qū)間的上限與下限之差,常用i表示。組距、組數(shù)、極差有如下關系:i=R/組數(shù)為了便于計算,組距一般取整數(shù)。本例R=25.8,分為9組,故組距:(i)=25.8/9=2.9≈3.0(kg)3.確定組中值與組限組中值是各組區(qū)間的中點值,它可作為各組的代表值,最好取整數(shù)或與觀察值位數(shù)一致。一般先確定第一組的組中值,通常選接近資料中最小觀察值為宜。例2.1九個組中值分別為:48.5,51.5,54.5,57.5,…,72.5組限即各組的界限,常用L表示,同一組中數(shù)值小者稱為下限,數(shù)值大者稱為上限。47.01---50.0050.01---53.0053.01---56.00|71.01---74.00例2.1的組限分別為:4.數(shù)據(jù)歸組

組限的小數(shù)位數(shù)比觀察值多取一位;為避免歸組時出現(xiàn)差錯,組限一定要明確,不能有重疊、交叉。(二)計數(shù)資料的次數(shù)分布表【例如】某小麥品種的每穗小穗數(shù)的次數(shù)分布。變異較小的資料,可按觀察值分組.

每穗小穗數(shù)記數(shù)符號次數(shù)151617181920正一正正正正正正正正正T正正正正正正正正T正6153225175【例如】研究水稻品種的每穗粒數(shù),共測115個穗,每穗粒數(shù)的變幅在20-139,極差達119.變異較大的計數(shù)資料,可用處理計量資料的方法制作次數(shù)分布表。分組20-2930-3940-4950-5960-6970-7980-8990-99100-109110-119120-129130-139次數(shù)14914151822147731(三)質量性狀資料的次數(shù)分布表

例如,用某微肥處理后,紅星蘋果果實著色情況調查,見下表。果實著色分級代表值果實數(shù)全紅>2/3果面紅色1/3-2/3果面紅色<1/3果面紅色全綠54321143697537二、次數(shù)分布圖

(一)柱形圖(直方圖)

100株湘菊梨單株產(chǎn)量方柱形圖47.050.053.056.059.062.065.068.071.074.020151050適用于表示連續(xù)性變異資料的次數(shù)分布。100株湘菊梨單株產(chǎn)量折線圖48.551.554.557.560.563.566.569.572.5

20151050·········次數(shù)f(二)折線圖適用于計量資料的次數(shù)分布圖,且在同一圖上可比較兩組以上資料。100個麥穗每穗小穗數(shù)條形圖151617181920302520151050次數(shù)f適用于計數(shù)資料和質量性狀資料。(三)條形圖用來描述總體或樣本特征的數(shù),稱為

特征數(shù)。

第三節(jié)試驗資料的特征數(shù)反應其離散性的特征數(shù)是變異數(shù)。反應資料集中性的特征數(shù)是平均數(shù);平均數(shù)是數(shù)量資料的代表數(shù),用來表明資料中各觀測值相對集中的中心位置。一、平均數(shù)平均數(shù)是統(tǒng)計學中最常用的統(tǒng)計量,常用來進行資料間的比較。

資料中各觀察值的總和除以觀察值的個數(shù)所得的商,稱為算術平均數(shù)(arithmeticmean),簡稱平均數(shù)。通常用μ表示總體平均數(shù),表示樣本平均數(shù)。

1.算術平均數(shù)設有一個含N個觀察值的有限總體,其觀察值為y1,y2,…,yN,則該總體的算術平均數(shù)μ定義為:

因為總體內的個體數(shù)很多,總體平均數(shù)往往無從計算,所以,一般用樣本平均數(shù)作為總體平均數(shù)μ的估計值。

設有一個容量為n的樣本,其觀察值為,則該樣本的算術平均數(shù)可定義為:從總體中抽出的隨機樣本平均數(shù)是該總體平均數(shù)μ的無偏估計值。(1)離均差之和等于零。記為:(2)離均差平方和為最小。簡記為:平均數(shù)的基本性質:計算方法對于(n<30)未歸組的資料可以直接利用公式:【例2.2】在一水稻品種比較試驗中,某品種的5個小區(qū)產(chǎn)量分別為20.0,19.0,21.0,17.5,18.5(kg),求該品種的小區(qū)產(chǎn)量平均數(shù)。=(20.0+19.0+21.0+17.5+18.5)/5=19.2(kg)對已歸組的資料,其計算公式為:其中:yi—各組組中值;k—組數(shù);n—資料中所有觀察值的個數(shù);

fi—各組次數(shù);

【例2.3】利用加權法求100株湘菊梨單株產(chǎn)量的算術平均數(shù)。

=(48.5×3+51.5×6+…+69.5×7+72.5×4)/100=60.92(kg)(二)中數(shù)(M)

將觀察值按大小依次排列,當觀察值數(shù)目為奇數(shù)時,最中間的觀察值就是中數(shù);當觀察值數(shù)目為偶數(shù)時,最中間的兩個觀察值的算術平均數(shù)為中數(shù)。如2,2,3,4,7,8,9,11,14;5,7,8,9,10,11;(三)眾數(shù)(Mo)

在資料中出現(xiàn)次數(shù)最多的數(shù)或組中值。(四)幾何平均數(shù)(Mg)設有n個觀察值,其乘積開n次方所得的值,即為幾何平均數(shù),即如某一調查結果為:3,4,3,3,5,6,4,3,2,2二、變異數(shù)

它由兩個極端觀察值決定,受資料中不正常的極端值的影響大,沒有充分利用資料的全部信息,不能精確表示資料的變異度。(一)極差(二)方差每個觀察值與平均數(shù)之差即離均差;表示觀察值偏離平均數(shù)的距離。離均差的平方再求和簡稱平方和(sumofsquare)。記為SS。即

對樣本:對總體:將SS除以觀察值的個數(shù)得到平均平方和,稱之為方差(variance)??傮w方差等于總體平方和除以總體觀察值個數(shù)N,用表示,即:總體方差通常無法得到,而由樣本方差估計,樣本方差稱為均方(meansquare)記為或MS:

上式中的(n-1)稱為自由度(degreeoffreedom),簡記為df。它是指樣本內能獨立自由變動觀察值的個數(shù)。【例2.4】

有5個觀察值,其中4個觀察值的離均差為3,-2,3,5,那么第5個觀察值的離均差必為-9,才能滿足:

在估計其他統(tǒng)計數(shù)時,如該統(tǒng)計數(shù)受k個條件限制,則自由度等于樣本觀察值個數(shù)減去約束條件數(shù)k,即樣本自由度為n-k(三)標準差統(tǒng)計學上把方差或均方的平方根取正值稱為標準差。

樣本標準差:總體標準差:例2.5表2.7某水稻品種小區(qū)產(chǎn)量的方差和標準差的計算項目總和20.019.021.017.518.596.020.0-19.2=0.819.0-19.2=-0.221.0-19.2=1.817.5-19.2=-1.718.5-19.2=-0.70.640.043.242.890.49400.0361.0441.0306.25342.2507.301850.50

若比較兩個樣本的變異度,則因單位不同或平均數(shù)不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論