X2檢驗第三講t檢驗_第1頁
X2檢驗第三講t檢驗_第2頁
X2檢驗第三講t檢驗_第3頁
X2檢驗第三講t檢驗_第4頁
X2檢驗第三講t檢驗_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二講X2測驗一、X2檢驗的意義

判斷觀察資料對自然規(guī)律的代表性如何,即實際數(shù)值與理論數(shù)值之間符合的程度如何,常用X2測驗法。

1899年Karlpearson完善了X2檢驗法和X2值的抽樣分布表(chi-squaredistributiontable),其基本推導及內(nèi)容為:

1、計數(shù)資料對某種理論的符合程度

K

設(shè)0為實際次數(shù),T為理論次數(shù)∑(0-T)=0i=1n、為所有情況之總體數(shù);K為總情況數(shù)。第一頁,共三十八頁。例:檢查F2代400株中紅花281株、白花119株、理論為300株、100株?!疲?300-281)+(100-119)=0無意義。b、改進

K∑(0-T)2若結(jié)果=0,說明觀察值與理論值完全吻合;

i=1∑(0-T)2的數(shù)值越小,說明實際次數(shù)與理論次數(shù)越接近,但不能說明實際次數(shù)和理論次數(shù)之間的差異程度。

例:(5-1)2=16.(504-500)2=16.

絕對數(shù)值相等,但差別程度相差很大。

第二頁,共三十八頁。c、將絕對數(shù)值折合成理論次數(shù)的百分比,即實際次數(shù)與理論次數(shù)差異的程度。二、X2的分布及其顯著性從總體中抽取若干個樣本,得若干個實際值,按照已定的理論值,可以算出若干個X2值,用X2值作橫坐標,次數(shù)為縱坐標就組成了X2次數(shù)分布圖。

a、X2值是間斷型的,X2分布卻是連續(xù)型的分布。呈偏態(tài)分布。

b、X2分布自由度越小偏態(tài)越大,自由度接近無限大時,曲線形態(tài)為常態(tài)分布。

c、X2具有可加性,即把一定個數(shù)的X2相加,是X2的總值的分布也是X2分布,其自由度為各個部分自由度之和。第三頁,共三十八頁。三、X2測驗的運用1、適合性的測定1)、(1×2)表例:隨機抽取F2代400株,紅花281,白花119株。a、設(shè)立零值假設(shè),即是按3:1比例分離。b、求出理論值

400×3/4=300400×1/4=100項目400

紅花白花實得數(shù)281119

理論數(shù)300100

(0-T)-1919

(0-T)2T1.20333.6100第四頁,共三十八頁。

(0-T)2X2=∑[]=1.20+3.6100=4.8133T

這里共分兩組df=2-1=1

X20.05=3.84X2>X20.05.

結(jié)論:理論與實際不相符,差異顯著。例2、抽查總數(shù)200株,紅花142株,白花58株。是否為一對基因控制。

014258T15050

(0-T)-88

(0-T)2T0.4271.280X2=0.427+1.280=1.707df=1X20.05=3.84X2<X20.05

,結(jié)論:性狀是受一對基因控制。第五頁,共三十八頁。2)、(1×n)表例:玉米雜交試驗中,種子紫色甜質(zhì)(PPss)與種子白色粉質(zhì)(ppSS)進行雜交,在F2代的1616株植株中,其表型分為四種,分別為:紫色粉質(zhì)921株白色粉質(zhì)279株紫色甜質(zhì)312株白色甜質(zhì)104株

試問兩對性狀是否為獨立遺傳?a、設(shè)是獨立遺傳,F(xiàn)2各表型之比為9:3:3:1b、1616×9/16=909株1616×3/16=303株

1616×3/16=303株1616×1/16=101株X2=(921-909)2/909+(312-303)2/303+(279-303)2/303+

(104-101)2/101=2.415c、df=4-1=3X20.05=7.82X2<X20.05

,結(jié)論:屬獨立遺傳。第六頁,共三十八頁。2、獨立性檢驗

生物體性狀與性狀之間,或生物體性狀表現(xiàn)與環(huán)境因素相互之間的關(guān)系,環(huán)境因子是獨立的還是相互影響的。1)、(2×2)式表例:研究吸煙習慣與慢性氣管炎發(fā)病關(guān)系。調(diào)查了205名吸煙者和

134名不吸煙者,結(jié)果如下表:組別患氣管炎未患氣管炎合計%

吸煙a.43b.1622052.1

不吸煙c.13d.1211349.7

合計5628333916.5第七頁,共三十八頁。a、假設(shè)吸煙與患氣管炎之間沒有聯(lián)系,二者是獨立的。

b、簡便計算方法

(ad-bc)2·nX2=

(a+b)(c+d)(a+c)(b+d)(43×121-13×162)2×339205×134×56×283X2

=7.4206c、自由度:將橫行自由度與縱行自由度相乘即可。四格表,自由度為1,查α=0.01時X2值為6.63X2>X20.01,有極其顯著差異。表明吸煙與患慢性氣管炎之間不獨立,二者之間有聯(lián)系。聯(lián)系系數(shù)用

C=√X2/N+X2計算

C=√7.4206/339+7.4206=√7.4206/346.4206=±0.1464第八頁,共三十八頁。2)、(2×J)表

(2×j)表指縱(橫)行數(shù)為2,橫(縱)行數(shù)多于2的分類表,用來比較兩個以上水平對實驗成功率的影響。

例:中山醫(yī)院研究急性白血病患者與慢性白血病患者之血型構(gòu)成情況有無顯著不同,資料如下:

血型組別ABOAB合計急性56(63.0)49(47.4)59(57.38)18(16.22)184慢性43(38.0)27(28.6)33(34.62)9(9.78)111合計101769226295本資料是2行4列,稱為2×4表共8格。(1)、假設(shè):白血病與血型無關(guān),是互相獨立的,根據(jù)無關(guān)假設(shè)求各格的理論值。第九頁,共三十八頁。第一格理論數(shù)=184×101/295=63.0101-63=38第二格理論數(shù)=184×76/295=47.476-47.4=28.6第三格理論數(shù)=184×92/295=57.3892-57.38=34.62第四格理論數(shù)=184×26/295=16.2226-16.22=9.78(2)、根據(jù)求X2公式求X2值X2=(58-63.)2/63+(49-47.4)2/47.4+(59-57.38)2/57.38

+…(9-9.78)/9.78=0.39682+0.054.+…+0.3239=1.839自由度df=(2-1)×(4-1)=3X20.05=7.815X2<X20.05P>0.05.結(jié)論:差異不顯著。第十頁,共三十八頁。3、理論曲線擬合的吻合度檢驗理論次數(shù)與實際次數(shù)的一致程度,稱作理論曲線擬合的吻合度。

兩點注意事項:(1)、各組內(nèi)理論次數(shù)不得小于5,如果小于5時則要進行合并,把相鄰的組加在一起進行計算。(2)、自由度計算:A、二項分布df=n-2.b、常態(tài)分布df=n-3.c、普阿松分布df=n-2.第十一頁,共三十八頁。練習題一、大豆花色一對等位基因的遺傳研究,在F2代獲得289株分離株數(shù),其中紫色208株,白色81株,問這一資料是否符合

3:1的理論數(shù)值?二、有一水稻遺傳試驗,以有色非糯性與無色糯性品種雜交,其結(jié)果如下,有色非糯491株,有色糯性76株,無色非糯90

株,無色糯性86株,問是否符合兩對等位基因獨立分配規(guī)律?三、水稻在三種密度情況下各200株中紋枯病的發(fā)病情況如下:實際情況密度1密度2密度3總計病株數(shù)264154121健株數(shù)174159146479試分析密度不同與紋枯病發(fā)生有無關(guān)系。第十二頁,共三十八頁。第三講t測驗一、學習目標

1、了解t測驗的應(yīng)用范圍;

2、能夠處理實際問題。二、教學重點

t測驗的應(yīng)用。三、教學難點

t測驗原理的理解。四、教學方法講述法。五、教學學時

4學時。六、本章練習

3題第十三頁,共三十八頁。一、t測驗的意義

樣本是總體的一部分,統(tǒng)計值與參數(shù)之間只能逼近不可能完全符合,就有誤差存在,稱為抽樣誤差。在不同總體中抽樣,樣本間也存在誤差,稱為本質(zhì)的差別。顯著性測驗的作用主要是檢驗兩種假設(shè),即兩個總體是否相等,兩個樣本是否來自同一總體。二、t分布及其測驗步驟一)、t分布的意義

1、t分布(t·Distribution)。從總體中抽取很多樣本,樣本平均數(shù)與總體平均數(shù)之差,除以該樣本的標準誤差,稱為這樣,一個樣本有一個t值,抽多少個樣本就有多少個t值,集合很多t值,就形成t值的概率分布。差值是標準誤的多少倍。第十四頁,共三十八頁。

1908年,willamseulgGosset提出在沒有總體而以樣本為對象時,在重復抽樣所得的x和S樣本值之間也有某種關(guān)系的存在,即以樣本為對象,也可以進行差異顯著性的測定,而用以下的公式來求出t值。

:甲樣本的平均數(shù)。

:乙樣本的平均數(shù)。

:甲乙兩樣本平均數(shù)差數(shù)的估計標準誤。此公式的意義為:甲乙兩樣本平均數(shù)的差數(shù)相當于差數(shù)估計標準誤的若干倍,即t值。第十五頁,共三十八頁。二)、步驟A、設(shè)立零值假說,假設(shè)二樣本來自同一總體,兩事物之間沒有本質(zhì)差別。

B、根據(jù)觀察值計算出x(平均數(shù))、二樣本變數(shù)間差異估計標準誤Sd.C、計算出t值,并得出結(jié)論。t測驗主要應(yīng)用于小樣本的抽樣估計,可以了解幾種不同情況的差異是否顯著。如:1、樣本平均數(shù)與總體均數(shù)的差異顯著性;2、兩個樣本平均數(shù)之間差異顯著性;3、兩個樣本百分數(shù)之間差異顯著性等。第十六頁,共三十八頁。三、樣本平均數(shù)與總體均數(shù)之間差異顯著性測定

一般情況:經(jīng)過幾年,多次測定,數(shù)值比較穩(wěn)定在一個范圍內(nèi),其均數(shù)可以當作總體均數(shù)。而將某次測驗結(jié)果當作一次取樣對待。

例:某奶牛場有奶牛500頭,每年產(chǎn)奶油20,000斤左右,現(xiàn)隨意抽取10頭奶牛為樣本,測得產(chǎn)奶油為每頭平均45斤,標準差為13.2斤,問樣本平均數(shù)(45)與總體平均數(shù)(40)之間的差異是否顯著?

第十七頁,共三十八頁。解:A、假設(shè)波動是抽樣誤差,樣本平均數(shù)與總體平均數(shù)之間沒有顯著差異。

B、依據(jù)已知數(shù)據(jù)求出標準誤

D、df=n-1=10-1=9P=0.05t=2.262t<t0.05P>0.05

C、

第十八頁,共三十八頁。E、結(jié)論:原假設(shè)成立,樣本平均數(shù)與總體平均數(shù)之間差異不顯著。假設(shè)成立,說明樣本來自總體,這種結(jié)論有95%以上的可靠性。

四、大樣本均數(shù)間差異顯著性測驗樣本含量增大時,分布接近常態(tài)分布,所以只需要算出兩個樣本平均數(shù)的相差數(shù)為其估計差數(shù)標準誤的多少倍就行了,不需要去查表,就可以判斷其差異是否顯著。

第十九頁,共三十八頁。在測定樣本平均數(shù)與總體平均數(shù)之間的差異顯著性,衡量差異的單位是平均數(shù)估計標準誤Sd,對于兩個樣本之間的差異的衡量,一般都用差異估計標準誤,用字母Sd表示,是根據(jù)樣本的變異量求出其近似值。不同的情況下,估計差異標準誤的計算方法不同。

對于大樣本資料,其估計差異標準誤Sd的求法采用下面公式:兩個樣本合并的變異數(shù),總要比一個樣本變異數(shù)量大些。如果兩個樣本都是獨立地取自同一總體,當這兩個樣本變得適當大時,它們的變異量應(yīng)該相等。即:

第二十頁,共三十八頁。例:在矮壯素噴灑小麥對產(chǎn)量影響的試驗中,采用苗期和抽穗期兩個時期,產(chǎn)量結(jié)果如表,問噴藥對產(chǎn)量影響是否顯著。

不同生長期噴灑矮壯素對小麥產(chǎn)量的影響處理時期小區(qū)數(shù)小區(qū)平均產(chǎn)量(斤)標準差苗期30076.56.2抽穗期36068.55.8若n1=n2第二十一頁,共三十八頁。

解:A、設(shè)不同時期噴藥對產(chǎn)量無效。

B、C、t=76.5-68.8/0.47=16.38d、t>2.57.(t0.01=2.57.t0.05=1.96

勿需查表,差異極顯著。

結(jié)論:不同時期噴藥對產(chǎn)量有極大影響,苗期噴灑比抽穗期噴灑對產(chǎn)量的影響更大。第二十二頁,共三十八頁。五、小樣平均數(shù)間差異顯著性測定小樣平均數(shù)的分布和大樣本平均數(shù)的分布是有區(qū)別的。用以前的方法與實際情況就出入較大,因此,需要尋找更好的方法。

1、樣本變量配偶成對時的t值測定法

變量配偶成對的試驗(Pairedexperiment):

a、兩樣本觀察值個數(shù)是相等的。

b、每對樣本(或處理)所處的環(huán)境條件力求一致或接近。第二十三頁,共三十八頁。如:施肥與否對同一品種產(chǎn)量的影響;兩種農(nóng)藥對同一病害的治療效果,同一胎動物進行不同飼料喂養(yǎng),對其生長的影響等。小樣本情況下,計算t值比較麻煩的是求差異標準誤Sd,Sd是估計差異標準誤,求Sd首先要由二成對數(shù)之差求出估計差異標準差,設(shè)d為二成對數(shù)之差數(shù),Sd為估計差異標準差,d為差異平均數(shù),其估計差數(shù)標準差為:標準差:第二十四頁,共三十八頁。其估計差異標準誤為:直接計算t值時,用下式計算:或者例:對兩個小麥品種進行產(chǎn)量比較試驗,分別在10個點進行,獲得產(chǎn)量(斤/區(qū))如下表:10個點可以看作是10個重復二品種在每個點的種植條件是基本一致的,屬配偶成對。第二十五頁,共三十八頁。

t值計算表點號甲產(chǎn)量乙產(chǎn)量dd213783791123823908643380389981437638486453793790063813909817382369131698375386111219385388391037939011121合計∑1=3797

∑2=3870∑d=73∑d2=711x1=379.7x2=387.0第二十六頁,共三十八頁。解法A:1)、設(shè)兩個品種在產(chǎn)量上無差異。

2)、3)、

df=n-1=9t0.01=3.25t>t0.01P<0.014)、結(jié)論:差異極其顯著,兩品種在產(chǎn)量上的差異是真實的。T值取其絕對值第二十七頁,共三十八頁。

解法B:1)、假設(shè)兩個品種是從差數(shù)均數(shù)為零的總體中抽出來的,差異是由抽樣誤差造成(兩品種無差異)。2)、3)、5)、結(jié)論:二樣本均數(shù)不是從差數(shù)均值為零的總體中抽出來的,差異極顯著。4)

df=n-1=9t0.01=3.25t>t0.01P<0.01第二十八頁,共三十八頁。2、樣本變量非配偶成對的t值測定法樣本變量非配偶成對,主要是指兩個樣本行列沒有相關(guān)性,彼此之間沒有內(nèi)在聯(lián)系存在,如進行比較時,一個品種可以播種在甲地的n1

小區(qū)內(nèi)。另一品種播種在乙地的n2

小區(qū)內(nèi),不必在同一塊田地進行對比。對配偶成對與否的資料進行t測驗時,其主要區(qū)別是計算兩樣本差數(shù)估計標準的方法有所不同。有兩種情況:一是兩樣本彼此間無聯(lián)系,但變數(shù)個數(shù)相等,即:n1=n2=n3……第二種情況是兩樣本彼此無相關(guān),而變數(shù)個數(shù)也不相等,n1≠n2。第二十九頁,共三十八頁。A、第一種情況,每個樣本及差數(shù)的變異量為:樣本1、樣本2、自由度可按:2(n-1)確定。第三十頁,共三十八頁。B、第二種情況由于配對與非配對的試驗設(shè)計不同,差數(shù)標準差的公式有所不同,配對時求合并標準差。例:不同肥料條件下栽培小麥,蛋白質(zhì)含量如下:問兩種小麥籽粒含蛋白量是否有差別?第三十一頁,共三十八頁。樣本號蛋白質(zhì)含量甲x1

乙x2(x1

-x1)2(x2

-x2)2112.613.10.01960.0049213.413.40.43560.1369311.912.80.70560.0529412.813.50.00360.2209513.013.70.06760.0729612.70.1089712.40.3969Σx1=63.7Σx2=91.2Σ(x1-x1)2Σ(x2-x2)2x1=12.74x2=13.03=11.2320=0.9943第三十二頁,共三十八頁。解:a、假設(shè)沒有差別b、列表計算df=12-2=10t0.05

=2.228c、∵t<t0.05P>0.05.∴差異不顯著。第三十三頁,共三十八頁。3、兩個樣本百分數(shù)間差異顯著性檢驗許多計數(shù)資料的樣本統(tǒng)計數(shù)用百分數(shù)表示,即某種特征的單位數(shù)目在總數(shù)目中所占的比重。實驗中經(jīng)常遇到用百分數(shù)表示兩樣本之間的差異是否顯著的問題,對于這類問題亦可采用t測驗法。測驗的步驟為:A、設(shè)立零值假設(shè),設(shè)兩個樣本來自同一總體,二百分數(shù)間差異非本質(zhì)差異。B、計算百分數(shù)的標準差及均數(shù)標準誤。S=√Pqp+q=1C、根據(jù)每個樣本的標準誤就可求出其差異標準誤。第三十四頁,共三十八頁。Sd=P1q1

n+P2q2n根據(jù)零值假設(shè),即:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論