




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
次數(shù)分布和平均數(shù)第一頁,共五十一頁,編輯于2023年,星期六第一節(jié)總體及其樣本總體(population)----
具有共同性質(zhì)的個體所組成的集團(tuán).
有限總體----總體所包含的個體數(shù)目有無窮多個.
無限總體----由有限個個體構(gòu)成的總體.觀察值(observation)----每一個體的某一性狀、特性的測定數(shù)值.變數(shù)(variable)----觀察值集合起來,稱為總體的變數(shù)。變數(shù)又稱為隨機(jī)變數(shù)(randomvariable)。
第二頁,共五十一頁,編輯于2023年,星期六樣本(sample)----從總體中抽取若干個個體的集合稱為樣本(sample)。統(tǒng)計數(shù)(statistic)----測定樣本中的各個體而得的樣本特征數(shù),如平均數(shù)等,稱為統(tǒng)計數(shù)(statistic)。隨機(jī)樣本(randomsample)----從總體中隨機(jī)抽取的樣本稱為隨機(jī)樣本(randomsample)樣本容量(samplesize)----樣本中包含的個體數(shù)稱為樣本容量或樣本含量(samplesize)第三頁,共五十一頁,編輯于2023年,星期六第二節(jié)次數(shù)分布一、試驗資料的性質(zhì)與分類二、次數(shù)分布表三、次數(shù)分布圖第四頁,共五十一頁,編輯于2023年,星期六一、試驗資料的性質(zhì)與分類(一)數(shù)量性狀資料(二)質(zhì)量性狀資料第五頁,共五十一頁,編輯于2023年,星期六(一)數(shù)量性狀資料數(shù)量性狀(quantitativetrait)的度量有計數(shù)和量測兩種方式,其所得變數(shù)不同。
1.不連續(xù)性或間斷性變數(shù)(discontinuousordiscretevariable)
指用計數(shù)方法獲得的數(shù)據(jù)。
2.連續(xù)性變數(shù)(continuousvariable)
指稱量、度量或測量方法所得到的數(shù)據(jù),其各個觀察值并不限于整數(shù),在兩個數(shù)值之間可以有微量數(shù)值差異的第三個數(shù)值存在。第六頁,共五十一頁,編輯于2023年,星期六(二)質(zhì)量性狀資料
質(zhì)量性狀(qualitativetrait)指能觀察而不能量測的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無、絨毛的有無等。要從這類性狀獲得數(shù)量資料,可采用下列兩種方法:統(tǒng)計次數(shù)法于一定總體或樣本內(nèi),統(tǒng)計其具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目,按類別計其次數(shù)或相對次數(shù)。
2.
給分法給予每類性狀以相對數(shù)量的方法第七頁,共五十一頁,編輯于2023年,星期六二、次數(shù)分布表(一)間斷性變數(shù)資料的整理(二)連續(xù)性變數(shù)資料的整理(三)屬性變數(shù)資料的整理第八頁,共五十一頁,編輯于2023年,星期六(一)間斷性變數(shù)資料的整理現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機(jī)采取100個麥穗,計數(shù)每穗小穗數(shù),未加整理的資料列成表3.1。
第九頁,共五十一頁,編輯于2023年,星期六表3.1100個麥穗的每穗小穗數(shù)18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917第十頁,共五十一頁,編輯于2023年,星期六每穗小穗數(shù)(
y
)次數(shù)(f)1561615173218251917205總次數(shù)(
n
)100表3.2100個麥穗每穗小穗數(shù)的次數(shù)分布表從表3.2中看到,一堆雜亂的原始資料表3.1,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)過整理的資料也便于進(jìn)一步的分析。上述資料為間斷性變數(shù)資料,每穗小穗數(shù)在15—20的范圍內(nèi)變動,把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為6組,組與組間相差為1小穗,稱為組距。這樣可得表3.2形式的次數(shù)分布表。第十一頁,共五十一頁,編輯于2023年,星期六(二)連續(xù)性變數(shù)資料的整理茲以表3.4的100行水稻試驗的產(chǎn)量為例,說明整理方法。177215197
97123159245119119131149152167104161214125175219118192176175
95136199116165214
9515883137
80138151187126196134206137
98
97129143179174159165136108101141148168163176102194145173
75130149150161155111158131189
91142140154152163123205149155131209183
97119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表3.4140行水稻產(chǎn)量(單位:克)第十二頁,共五十一頁,編輯于2023年,星期六具體步驟:
1.數(shù)據(jù)排序(sort)
首先對數(shù)據(jù)按從小到大排列(升序)或從大到小排列(降序)。
2.求極差(range)
所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為極差,亦即整個樣本的變異幅度。從表3.4中查到最大觀察值為254g,最小觀察值為75g,極差為254-75=179g。第十三頁,共五十一頁,編輯于2023年,星期六
3.確定組數(shù)和組距(classinterval)
根據(jù)極差分為若干組,每組的距離相等,稱為組距。
在確定組數(shù)和組距時應(yīng)考慮:
(1)觀察值個數(shù)的多少;
(2)極差的大??;
(3)便于計算;
(4)能反映出資料的真實面貌等方面。樣本大小(即樣本內(nèi)包含觀察值的個數(shù)的多少)與組數(shù)多少的關(guān)系可參照表3.5來確定。第十四頁,共五十一頁,編輯于2023年,星期六表3.5樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個數(shù)分組時的組數(shù)50
5—10100
8—1620010—2030012—2450015—30100020—40組數(shù)確定后,還須確定組距。組距=極差/組數(shù)。以表3.4中140行水稻產(chǎn)量為例,樣本內(nèi)觀察值的個數(shù)為140,查表3.5可分為8—16組,假定分為12組,則組距為179/12=14.9g,為分組方便起見,可以15g作為組距。第十五頁,共五十一頁,編輯于2023年,星期六
4.選定組限(classlimit)和組中點值(組值,classvalue)
以表3.4中140行水稻產(chǎn)量為例,選定第一組的中點值為75g,與最小觀察值75g相等;則第二組的中點值為75+15=90g,余類推。各組的中點值選定后,就可以求得各組組限。每組有兩個組限,數(shù)值小的稱為下限(lowerlimit),數(shù)值大的稱為上限(upperlimit)。上述資料中,第一組的下限為該組中點值減去1/2組距,即75-(15/2)=67.5g,上限為中點值加1/2組距,即75+(15/2)=82.5g。故第一組的組限為67.5—82.5g。按照此法計算其余各組的組限,就可寫出分組數(shù)列。第十六頁,共五十一頁,編輯于2023年,星期六
5.把原始資料的各個觀察值按分組數(shù)列的各組組限歸組
可按原始資料中各觀察值的次序,逐個把數(shù)值歸于各組。待全部觀察值歸組后,即可求得各組的次數(shù),制成一個次數(shù)分布表。例如表3.4中第一個觀察值177應(yīng)歸于表3.6中第8組,組限為172.5—187.5;第二個觀察值149應(yīng)歸于第6組,組限為142.5—157.5;……。依次把140個觀察值都進(jìn)行歸組,即可制成140行水稻產(chǎn)量的次數(shù)分布表(表3.6)。第十七頁,共五十一頁,編輯于2023年,星期六表3.6140行水稻的次數(shù)分布組限中點值(
y
)次數(shù)(f)
67.5—82.5752
82.5—97.5907
97.5—112.51057112.5—127.512013127.5—142.513517142.5—157.515020157.5—172.516525172.5—187.518021187.5—202.519513202.5—217.52109217.5—232.52253232.5—247.52402247.5—262.52551合計(
n
)140
注:前面提到分為12組,但由于第一組的中點值接近于最小觀察值,故第一組的下限小于最小觀察值,實際上差不多增加了1/2組;這樣也使最后一組的中點值接近于最大值,又增加了1/2組,故實際的組數(shù)比原來確定的要多一個組,為13組。第十八頁,共五十一頁,編輯于2023年,星期六(三)屬性變數(shù)資料的整理屬性變數(shù)的資料,也可以用類似次數(shù)分布的方法來整理。在整理前,把資料按各種質(zhì)量性狀進(jìn)行分類,分類數(shù)等于組數(shù),然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,即可得到屬性分布的規(guī)律性認(rèn)識。例如,某水稻雜種第二代植株米粒性狀的分離情況,歸于表3.7。表3.7水稻雜種二代植株米粒性狀的分離情況屬性分組(
y
)次數(shù)(
f)紅米非糯96紅米糯稻37白米非糯31白米糯稻15合計(
n
)179第十九頁,共五十一頁,編輯于2023年,星期六三、次數(shù)分布圖(一)方柱形圖(二)多邊形圖(三)條形圖(四)餅圖第二十頁,共五十一頁,編輯于2023年,星期六
(一)方柱形圖方柱形圖(histogram)適用于表示連續(xù)性變數(shù)的次數(shù)分布。
現(xiàn)以表3.6的140行水稻產(chǎn)量的次數(shù)分布表為例加以說明。即成方柱形次數(shù)分布圖3.1。圖3.1140行水稻產(chǎn)量次數(shù)分布方柱形圖第二十一頁,共五十一頁,編輯于2023年,星期六(二)多邊形圖
多邊形圖(polygon)也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。仍以140行水稻產(chǎn)量次數(shù)分布為例,所成圖形即為次數(shù)多邊形圖(圖3.2)。圖3.2140行水稻產(chǎn)量次數(shù)分布多邊形圖第二十二頁,共五十一頁,編輯于2023年,星期六(三)條形圖
條形圖(bar)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點值或分類性狀,縱軸標(biāo)出次數(shù)?,F(xiàn)以表3.7水稻雜種第二代米粒性狀的分離情況為例,可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖(3.3)。圖3.3水稻F2代米粒性狀分離條形圖第二十三頁,共五十一頁,編輯于2023年,星期六
(四)餅圖
餅圖(pie)適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個數(shù)中的百分比。如圖3.4中白米糯稻在F2群體中占8%,白米非糯、紅米糯稻和紅米非糯分別占17%、21%和54%。圖3.4水稻F2代米粒性狀分離的餅圖第二十四頁,共五十一頁,編輯于2023年,星期六第三節(jié)平均數(shù)一、平均數(shù)的意義和種類二、算術(shù)平均數(shù)的計算方法三、算術(shù)平均數(shù)的重要特性四、總體平均數(shù)第二十五頁,共五十一頁,編輯于2023年,星期六一、平均數(shù)的意義和種類平均數(shù)的意義:
平均數(shù)(average)是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。第二十六頁,共五十一頁,編輯于2023年,星期六平均數(shù)的種類:(1)算術(shù)平均數(shù)一個數(shù)量資料中各個觀察值的總和除以觀察值個數(shù)所得的商數(shù),稱為算術(shù)平均數(shù)(arithmeticmean),記作。因其應(yīng)用廣泛,常簡稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。
(2)中數(shù)將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為中數(shù)(median),計作Md。如觀察值個數(shù)為偶數(shù),則以中間二個觀察值的算術(shù)平均數(shù)為中數(shù)。第二十七頁,共五十一頁,編輯于2023年,星期六
(3)
眾數(shù)資料中最常見的一數(shù),或次數(shù)最多一組的中點值,稱為眾數(shù)(mode),計作MO。如棉花纖維檢驗時所用的主體長度即為眾數(shù)。
(4)幾何平均數(shù)如有n個觀察值,其相乘積開n次方,即為幾何平均數(shù)(geometricmean),用G代表。
(3·1)平均數(shù)的種類:第二十八頁,共五十一頁,編輯于2023年,星期六二、算術(shù)平均數(shù)的計算方法若樣本較小,即資料包含的觀察值個數(shù)不多,可直接計算平均數(shù)。設(shè)一個含有n個觀察值的樣本,其各個觀察值為y1、y2、y3、…、yn,則算術(shù)平均數(shù)由下式算得:(3·2)若樣本較大,且已進(jìn)行了分組(如表3.6),可采用加權(quán)法計算算術(shù)平均數(shù),即用組中點值代表該組出現(xiàn)的觀測值以計算平均數(shù),其公式為(3·3)其中yi為第i
組中點值,fi為第i組變數(shù)出現(xiàn)次數(shù)。第二十九頁,共五十一頁,編輯于2023年,星期六
[例3.1]在水稻品種比較試驗中,湘矮早四號的5個小區(qū)產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg,求該品種的小區(qū)平均產(chǎn)量。
[例3.2]利用表3.6資料計算平均每行水稻產(chǎn)量。若采用直接法,=157.47。因此,兩者的結(jié)果十分相近。由(3·2)有第三十頁,共五十一頁,編輯于2023年,星期六三、算術(shù)平均數(shù)的重要特性
(1)樣本各觀察值與其平均數(shù)的差數(shù)(簡稱離均差,deviationfrommean)的總和等于0。即:
(2)樣本各觀察值與其平均數(shù)的差數(shù)平方的總和,較各個觀察值與任意其他數(shù)值的差數(shù)平方的總和為小,亦即離均差平方的總和最小。這個問題可作這樣的說明,設(shè)Q為各個觀察值與任意數(shù)值a的差數(shù)平方的總和,即:對此Q求最小值,可得使Q最小的a值為平均數(shù)。第三十一頁,共五十一頁,編輯于2023年,星期六四、總體平均數(shù)總體平均數(shù)用來代表,它同樣具有算術(shù)平均數(shù)所具有的特性。(3·4)上式y(tǒng)i代表各個觀察值,N代表有限總體所包含的個體數(shù),表示總體內(nèi)各個觀察值的總和。第三十二頁,共五十一頁,編輯于2023年,星期六第四節(jié)變異數(shù)一、極差二、方差三、標(biāo)準(zhǔn)差四、變異系數(shù)第三十三頁,共五十一頁,編輯于2023年,星期六一、極差
極差(range),又稱全距,記作R,是資料中最大觀察值與最小觀察值的差數(shù)。例如調(diào)查兩個小麥品種的每穗小穗數(shù),每品種計數(shù)10個麥穗,經(jīng)整理后的數(shù)字列于表3.8。表3.8
兩個小麥品種的每穗小穗數(shù)品種名稱每穗小穗數(shù)總和平均甲1314151718181921222318018乙1616171818181819202018018第三十四頁,共五十一頁,編輯于2023年,星期六表3.8資料中,甲品種每穗小穗數(shù)最少為13個,最多為23個,R=23-13=10個小穗;乙品種每穗小穗數(shù)最少為16個,最多為20個,R=20-16=4個小穗??梢钥闯?,兩品種的平均每穗小穗數(shù)雖同為18個,但甲品種的極差較大,其變異范圍較大,平均數(shù)的代表性較差;乙品種的極差較小,其變異幅度較小,其平均數(shù)代表性較好。第三十五頁,共五十一頁,編輯于2023年,星期六二、方差離均差平方和(簡稱平方和)SS----將各個離均差平方后相加樣本SS=
(3·5)
總體SS=
(3·6)均方或方差(variance)----用觀察值數(shù)目來除平方和
樣本均方(meansquare)用s2表示,定義為:
總體方差用表示,定義為:
樣本均方是總體方差的無偏估計值第三十六頁,共五十一頁,編輯于2023年,星期六三、標(biāo)準(zhǔn)差(一)標(biāo)準(zhǔn)差的定義
標(biāo)準(zhǔn)差為方差的正平方根值,用以表示資料的變異度,其單位與觀察值的度量單位相同。從樣本資料計算標(biāo)準(zhǔn)差的公式為:(3·9)總體標(biāo)準(zhǔn)差用表示:(3·10)樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計值。
第三十七頁,共五十一頁,編輯于2023年,星期六(二)自由度的意義
自由度記作DF,其具體數(shù)值則常用表示。統(tǒng)計意義:是指樣本內(nèi)獨立而能自由變動的離均差個數(shù)。例如一個有5個觀察值的樣本,因為受統(tǒng)計數(shù)的約束,在5個離均差中,只有4個數(shù)值可以在一定范圍之內(nèi)自由變動取值,而第五個離均差必須滿足。如一樣本為(3,4,5,6,7),平均數(shù)為5,前4個離差為-2,-1,0和1,則第5個離均差為前4個離均差之和的變號數(shù),即-(-2)=2。一般地,樣本自由度等于觀察值的個數(shù)(n)減去約束條件的個數(shù)(k),即。第三十八頁,共五十一頁,編輯于2023年,星期六
注:比較(3·9)和(3·10),樣本標(biāo)準(zhǔn)差不以樣本容量n,而以自由度n-1作為除數(shù),這是因為通常所掌握的是樣本資料,不知的數(shù)值,不得不用樣本平均數(shù)代替。與有差異,由算術(shù)平均數(shù)的性質(zhì)(2)可知,比小。因此,由算出的標(biāo)準(zhǔn)差將偏小。如分母用n-1代替,則可免除偏小的弊病。數(shù)理統(tǒng)計上可以證明用自由度作除數(shù)計算標(biāo)準(zhǔn)差的無偏性。第三十九頁,共五十一頁,編輯于2023年,星期六(三)標(biāo)準(zhǔn)差的計算方法
1.直接法
可按計算,分四個步驟:
(1)先求出,
(2)再求出各個和各個,
(3)求和得,
(4)代入算得標(biāo)準(zhǔn)差。第四十頁,共五十一頁,編輯于2023年,星期六
[例3.3]設(shè)某一水稻單株粒重的樣本有5個觀察值,以克為單位,其數(shù)為2、8、7、5、4(用y代表),按照上述步驟,由表3.9可算得平方和為22.80,把它代入
即可得到:這就是該水稻單株粒重的標(biāo)準(zhǔn)差為2.39g。第四十一頁,共五十一頁,編輯于2023年,星期六計算項目yy22-3.210.24482.87.846471.83.24495-0.20.04254-1.21.4416總和26022.80158平均5.2表3.9
水稻粒重的平方和的計算第四十二頁,共五十一頁,編輯于2023年,星期六2.矯正數(shù)法
經(jīng)過轉(zhuǎn)換可得
(3·11)其中項稱為矯正數(shù),記作C。在例3.3中,于表3.9第5列寫出各觀察值的平方值,將有關(guān)數(shù)字代入(3·11)即有:其結(jié)果和直接法算得相同。第四十三頁,共五十一頁,編輯于2023年,星期六3.
加權(quán)法
若樣本較大,并已獲得如表3.6的次數(shù)分布表,可采用加權(quán)法計算標(biāo)準(zhǔn)差,其公式為:(3·12)第四十四頁,共五十一頁,編輯于2023年,星期六組限中點值(
y
)次數(shù)(f)
67.5—82.5752
82.5—97.5907
97.5—112.51057112.5—127.512013127.5—142.513517142.5—157.515020157.5—172.516525172.5—187.518021187.5—202.519513202.5—217.52109217.5—232.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級地理上冊 第三章 第二節(jié) 世界的人種教學(xué)設(shè)計 (新版)蘇教版
- 精防所嚴(yán)重精神障礙課件
- 眾創(chuàng)空間管理辦法
- 2025年高考英語二輪復(fù)習(xí)測試01 詞類綜合+語法填空(測試)(解析版)
- 環(huán)保低碳的住宅建筑考核試卷
- 環(huán)境監(jiān)測儀器儀表的振動與沖擊測試考核試卷
- 2023七年級英語上冊 Module 4 Healthy food Unit 2 Is your food and drink healthy教學(xué)設(shè)計 (新版)外研版
- 2025小學(xué)防溺水安全教育計劃
- 鐵路軌道結(jié)構(gòu)與施工47課件
- 文旅直播面試題及答案
- DB32∕T 1713-2011 水利工程觀測規(guī)程
- 遺傳算法最新版本課件(PPT 70頁)
- 中學(xué)生生涯規(guī)劃《MBTI-性格與職業(yè)探索》課件
- 第04章 計算機(jī)輔助設(shè)計-1
- 2022年00642《傳播學(xué)概論》復(fù)習(xí)資料
- 旅游規(guī)劃中的利益相關(guān)者解析
- 鋁合金化學(xué)成分表
- (精選)基礎(chǔ)施工長螺旋鉆孔壓灌樁技術(shù)交底
- 采用SIMMENS802D系統(tǒng)的CK5116數(shù)控立車刀架控制設(shè)計
- 《監(jiān)控系統(tǒng)方案》word版
- BWASI網(wǎng)關(guān)使用手冊-第10章節(jié)
評論
0/150
提交評論