生物統(tǒng)計(jì)學(xué) 總結(jié)_第1頁
生物統(tǒng)計(jì)學(xué) 總結(jié)_第2頁
生物統(tǒng)計(jì)學(xué) 總結(jié)_第3頁
生物統(tǒng)計(jì)學(xué) 總結(jié)_第4頁
生物統(tǒng)計(jì)學(xué) 總結(jié)_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物統(tǒng)計(jì)學(xué) 總結(jié)緒論統(tǒng)計(jì)工作的四大步驟:設(shè)計(jì)、搜集、整理、分析統(tǒng)計(jì)資料的三大類型:e 計(jì)量資料:對每個觀察值單位用定量方法測得每項(xiàng)指標(biāo)量的大小所得的資料e 計(jì)數(shù)資料:將觀察單位按照某種屬性類別分組,所得的觀察單位數(shù)e 等級資料:將觀察單位按某種屬性的不同程度分組所得的資料同質(zhì)與變異同質(zhì):除研究因素外,其他因素相同或相近為同質(zhì)變異:觀測值的不齊性總體與樣本:總體:根據(jù)研究目的所確定的同質(zhì)觀察單位的全體=所有研究對象性質(zhì)相同的全體觀察單位某項(xiàng)變量值的集合總體含量:總體中所包含的觀察單位數(shù)有限總體:總體觀察單位數(shù)可數(shù)無限總體:總體觀察單位數(shù)不可數(shù)樣本:從總體中隨機(jī)抽取的部分觀察單位樣本含量:樣本中所

2、包含的觀察單位數(shù)抽樣:從總體中獲得樣本的過程放回式抽樣不放回式抽樣抽樣誤差:因個體變異的存在,由抽樣而導(dǎo)致的樣本指標(biāo)與總體指標(biāo)之差統(tǒng)計(jì)量:有樣本所得指標(biāo)或數(shù)參數(shù):由總體所得指標(biāo),關(guān)于特征的表征頻數(shù):完全相同的觀察只出現(xiàn)的次數(shù)頻率:某一觀察值出現(xiàn)的次數(shù)與樣本含量的比值概率:描述某事物發(fā)生可能性大小的一個度量樣本空間:一次實(shí)驗(yàn)所有可能的結(jié)果的集合基本事物:樣本空間每一個可能的結(jié)果小概率事件:P<=0.05或P<=0.01的事件小概率原理:小概率事件在一次抽樣中不可能發(fā)生計(jì)量資料的統(tǒng)計(jì)描述集中趨勢的指標(biāo):平均數(shù)定義:描述一組同質(zhì)計(jì)量資料的集中趨勢,反映某一組觀察值的平均水平或某一分布的平

3、均位置的指標(biāo)作用:作為一組資料的代表值,可用于組間的分析比較均數(shù)的兩個重要特征à代表性1. 離均差和等于02. 離均差平方最小小于常用平均數(shù)指標(biāo):1.算術(shù)均數(shù)(1)定義:全部觀察值相加之和除以觀察值個數(shù)所得的商總體均數(shù) 樣本均數(shù)(2)算法:1)直接法:2)加權(quán)法:3)縮減法(3)注意事項(xiàng):1)只有在合理分組的基礎(chǔ)上對同質(zhì)數(shù)據(jù)取均數(shù)才有意義2)均數(shù)用于近似正態(tài)分布的對稱分布,尤其是正態(tài)分布2.幾何均數(shù)G(不能用算術(shù)均數(shù)時)(1)定義:幾個觀察值相乘之積,開幾次方所得根(2)計(jì)算1)直接法2)(3)應(yīng)用注意:1)幾何均數(shù)適用于觀察值相差很大,甚至呈倍數(shù)關(guān)系(等比或幾何級數(shù)資料)或用于對數(shù)

4、正態(tài)分布資料2)觀察值不能有零,不能同時有正負(fù),若都為負(fù),去符號最后加符號,觀察值比較小或有零,可加1,最后減去3)同一資料求得的幾何均數(shù)小于均數(shù)中位數(shù)M(1)定義:把一組觀察值按大小順序排列,位次居中的(2)計(jì)算:1)直接法2)頻數(shù)表法:(3)注意事項(xiàng)1)適用場合:偏態(tài),開口(一端或兩端無界限),分布不清的2)特性:只代表了居中觀察值的特性,敏感性低,不受特小特大值的影響3)對于正態(tài)分布資料,理論上,中位數(shù)=均數(shù)(數(shù)值上)百分位數(shù)(1)定義:將n個觀察值由小到大排列,編上秩次,將n個秩次100等分,與X%秩次相對應(yīng)的數(shù)值,即X的百分位數(shù),是一個位置指標(biāo),以Px表示(x代表百分秩次)Px將整個

5、數(shù)列分為兩半,X%比Px小,1-X%比Px大(2)計(jì)算:(3)應(yīng)用注意1)百分位數(shù)常用于描述一組資料(樣本或總體)在某百分位數(shù)上的水平和分布特征,多個百分位數(shù)結(jié)合使用,可全面描述觀察值分布特征,包括位置的大小和變異度2)一般分布中部的百分位數(shù)相當(dāng)穩(wěn)定,代表性好,靠近兩端的百分位數(shù),只在樣本含量足夠大(>120個)才足夠穩(wěn)定,所以當(dāng)樣本含量不夠大時,不宜取兩端百分位數(shù)3)用百分位數(shù)確定正常值范圍,習(xí)慣上95%離散趨勢的描述1. 極差R:樣本資料中最大值和最小值之差在一定程度上能說明樣本波動幅度的大小,但它只受樣本中兩個極端個體數(shù)值大小的影響,不能反映樣本中各個觀測值的變異程度,穩(wěn)定性差2.

6、 四分位數(shù)間距:是上四分位數(shù)與下四分位數(shù)之差,用四分位數(shù)間距可反映變異程度的大小.穩(wěn)定性好,靈敏度不夠3. 標(biāo)準(zhǔn)差:1) 定義:描述一組同質(zhì)計(jì)量資料離散程度大小的指標(biāo)反映了均數(shù)對一組觀察值的代表性說明了觀察值圍繞均數(shù)分布的離散程度,個體變異2) 計(jì)算:3) 應(yīng)用:1. 表示變量分布的離散程度2. 結(jié)合均數(shù)描述正態(tài)分布特征3. 結(jié)合均數(shù)計(jì)算變異系數(shù)4. 結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤4) 注意:(1) 不同單位,相同標(biāo)準(zhǔn)差,不能比較(2) 大個體差異大,變異度大,小個體則變異度小4.變異系數(shù)CV1) 定義:標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表示2) 計(jì)算:3) 應(yīng)用:單位不同的幾組資料變異度及均數(shù)相差懸殊的幾組

7、資料的變異度的比較,不單獨(dú)使用自由度泛指可以自由取值的變量的個數(shù)正常值:正常動植物解剖生理生化等各種數(shù)據(jù)的波動范圍1) 必要性1. 區(qū)分正常和異常2. 看不同種群在不同時間地域上某一指標(biāo)的差異2) 選取1. 極差中的一部分2. 單側(cè)或雙側(cè)正常值之分,由指標(biāo)實(shí)際情況及實(shí)驗(yàn)要求確定3. 方式之一為正常值范圍的百分位數(shù),習(xí)慣上95%雙側(cè):確定P2.5或P97.5單側(cè):P5或P95,看實(shí)驗(yàn)需要計(jì)量資料的統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷用樣本信息推斷總體特征參數(shù)估計(jì):由樣本結(jié)果對總體參數(shù)在一定概率水平下所做出的估計(jì)假設(shè)檢驗(yàn)正態(tài)分布1) 概念:一種連續(xù)型隨機(jī)變量的概率分布密度函數(shù):分布函數(shù):2) 特征:1. 在橫軸上均數(shù)

8、處最高2. 以均數(shù)為中心,左右對稱3. 有兩個參數(shù)4. 曲線下的面積分布有一定的規(guī)律F(x)3) 應(yīng)用:1. 以曲線下的面積反映頻率及概率分布2. 估計(jì)正常值范圍或正常值范圍的正態(tài)分布法à雙側(cè)正常值范圍3. 質(zhì)量控制4. 正態(tài)分布是很多種統(tǒng)計(jì)方法的理論基礎(chǔ)標(biāo)準(zhǔn)正態(tài)分布,u分布U與面積的關(guān)系對數(shù)正態(tài)分布原觀察值x呈偏態(tài)(正偏),取對數(shù)后,lgX呈正態(tài)分布àx服從對數(shù)正態(tài)分布均數(shù)的抽樣誤差1. 定義:平均數(shù)與總體均數(shù)之差2. 均數(shù)抽樣誤差大小的度量標(biāo)準(zhǔn)誤1) 定義:樣本均數(shù)的標(biāo)準(zhǔn)差2) 意義:反映抽樣誤差的大小是樣本均數(shù)圍繞總體均數(shù)分布的離散程度,衡量了樣本均數(shù)的可靠程度3)

9、計(jì)算:一般一次抽樣估計(jì)總體沒有標(biāo)準(zhǔn)誤,只針對樣本4) 用途:(1) 計(jì)算可信區(qū)間(參數(shù)估計(jì))(2) 用于統(tǒng)計(jì)推斷(假設(shè)檢驗(yàn))t分布1. t變換與t變量2. t分布的特征1) 單峰,一0為中心,左右對稱2) 曲線中間比正態(tài)分布低,兩端翹得比正態(tài)分布高3) 有無數(shù)根,中間越低,兩端越翹t分布與自由度有關(guān),自由度越小,中間越低,兩端越翹當(dāng)自由度趨向無窮時,t分布趨向標(biāo)準(zhǔn)正態(tài)分布,tàu3. 概率密度函數(shù)與分布函數(shù)4. t介值與t介值表t,:給定自由度為,兩側(cè)雙尾面積之和為時,相應(yīng)t值。5. t分布原理:P(-t,<= t <= t,)=1-方差分析方差分析又叫變量分析,俗稱F檢

10、驗(yàn)用途:1. 兩個或多個均數(shù)的比較2. 分離各有關(guān)因素,并分別估計(jì)其對變異的作用3. 分析兩個或多個因素的交互作用4. 方差齊性檢驗(yàn)適用條件(用于多個均數(shù)比較時)1. 個樣本是相互獨(dú)立的隨機(jī)樣本2. 小樣本要求正態(tài)方差齊基本思想:把全部觀察值之間的變異,總變異,按設(shè)計(jì)需要,分為兩個或多個組成部分再作分析計(jì)算總體均數(shù)的估計(jì)1. 總估計(jì)2. 區(qū)間估計(jì):1) 定義:按一定的概率估計(jì)總體均數(shù)在什么范圍內(nèi)可信區(qū)間:按一定的概率估計(jì)總體均數(shù)的可能范圍2) 方式:1. t分布法:按t分布的原理估計(jì)總體均數(shù)在什么范圍內(nèi)適用于總體標(biāo)準(zhǔn)差未知且n<50的情形總體均數(shù)在可信區(qū)間的概率1-可信度:1-置信水平:

11、通常,我們?nèi)?5%或99%作可信區(qū)間2. 正態(tài)分布法適用于總體標(biāo)準(zhǔn)差已知或n>50總體標(biāo)準(zhǔn)差已知:n>50:假設(shè)檢驗(yàn)為什么做假設(shè)檢驗(yàn)檢驗(yàn)差別是否由抽樣誤差造成的基本思想假定差別是由抽樣誤差引起的然后計(jì)算由抽樣誤差引起這么大,甚至比這更大的差別的概率P根據(jù)小概率原理,作出拒絕或者接受假設(shè)的判斷步驟1. 建立假設(shè),確定檢驗(yàn)水準(zhǔn)先確定是單側(cè)還是雙側(cè)的若考慮u,u0有誤差別à雙側(cè)若不僅考慮差別,還關(guān)注u,u0大小à單側(cè)一般認(rèn)為雙側(cè)無效假設(shè)H0:從反證法的基礎(chǔ)上提出的,無論何時,假設(shè)差別是由抽樣誤差造成的,但具體問題具體分析備擇假設(shè)H1:與H0相對立的假設(shè),是依H0而產(chǎn)生

12、的,一旦H0不成立,只能接受H1,現(xiàn)在H0不成立à非H0à體現(xiàn)單雙側(cè)之分檢驗(yàn)水準(zhǔn):界定小概率事件的一個標(biāo)準(zhǔn)(有單雙側(cè)之分)通常=0.052. 選定檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量3. 確定P值,做出統(tǒng)計(jì)推斷P值:指由H0所規(guī)定的總體中做隨機(jī)抽樣,獲得等于大于或小于現(xiàn)有統(tǒng)計(jì)量的概率。若P<=,拒絕H0;若P>,接受H0第一類錯誤和第二類錯誤e 第一類:拒絕實(shí)際上成立的H0e 第二類:不拒絕實(shí)際上不成立的H0客觀實(shí)際拒絕H0不拒絕H0H0成立第一類錯誤()推斷正確(1-)H0不成立推斷正確(1-)第二類錯誤()e 可信度 1-e 把握度 :未知,只能估計(jì),不能單獨(dú)存在,只有與H

13、1結(jié)合才有意義e 檢驗(yàn)效能1-:計(jì)量總體卻有差別,按水準(zhǔn),能夠發(fā)現(xiàn)他們有差別的能力注意1. 樣本的代表性à組間的均衡性à資料的可比性2. 選用的假設(shè)檢驗(yàn)方法一定要符合其適用條件3. 正確理解差別有無顯著性的含義(顯著、極顯著 不意味著差別的大?。?. 結(jié)論不能絕對化5. 報告要規(guī)范化檢驗(yàn)方法一、完全隨機(jī)設(shè)計(jì)(一)樣本均數(shù)與已知總體均數(shù)比較的假設(shè)檢驗(yàn)1. 小樣本,總體標(biāo)準(zhǔn)差未知àt檢驗(yàn)(要求 x 取自正態(tài)總體)2. 大樣本,總體標(biāo)準(zhǔn)差未知:1) t檢驗(yàn)(嚴(yán)格)à法2 無需來自正態(tài)總體2) u檢驗(yàn)(à,tàu)à法13. 大樣本

14、,總體標(biāo)準(zhǔn)差已知àu檢驗(yàn)(二)兩個樣本均數(shù)比較的假設(shè)檢驗(yàn)1. 小樣本(有一個就算),總體標(biāo)準(zhǔn)差未知,正態(tài)方差齊àt檢驗(yàn)A. 先求合并方差B. 再求兩樣本均數(shù)差的標(biāo)準(zhǔn)誤C. 計(jì)算t值2. 小樣本(有一個就算),總體標(biāo)準(zhǔn)差未知,方差不齊(非正態(tài))1) 采用適當(dāng)?shù)淖兞孔儞Q使達(dá)到方差齊性的要求2) 采用不要求方差齊的方法比較à非參數(shù)統(tǒng)計(jì)3) 采用近似的t檢驗(yàn)3. 大樣本àu檢驗(yàn)(不考慮正態(tài)方差齊的情況下,仍可用t檢驗(yàn))(三)兩個樣本幾何均數(shù)比較的假設(shè)檢驗(yàn)對x取反對數(shù),用t檢驗(yàn)或者u檢驗(yàn)(四)多個樣本均數(shù)的比較(單因素方差分析)條件:1. 個樣本是相互獨(dú)立的隨機(jī)樣

15、本2. 小樣本要求正態(tài)方差齊 *多個樣本均數(shù)間的兩兩比較àq檢驗(yàn)二、配對設(shè)計(jì)(一)配對設(shè)計(jì)的計(jì)量資料的比較小樣本,t檢驗(yàn)àt=dSd/n三、配伍組設(shè)計(jì)(一)多個樣本均數(shù)的比較(兩因素方差分析)多個性質(zhì)相同的配伍,同一配伍組中的N個受試對象分別接受k種處理作用:1.可改善處理組間的均衡性2.可分析配伍因素的的影響3.提高設(shè)計(jì)效率,分析兩個因素 *多個樣本均數(shù)間的兩兩比較àq檢驗(yàn)正態(tài)性檢驗(yàn)一、為什么做正態(tài)性檢驗(yàn)特定統(tǒng)計(jì)方法要求的描述統(tǒng)計(jì) 平均數(shù)、標(biāo)準(zhǔn)差 正常值范圍的正態(tài)統(tǒng)計(jì)法統(tǒng)計(jì)推斷 t檢驗(yàn) F檢驗(yàn)二、定義判定資料是否服從正態(tài)分布或樣本是否來自正態(tài)總體的一類檢驗(yàn)方法三

16、、何時用?1. 為了說明資料是否服從正態(tài)分布à一定要做2. 為了滿足特定統(tǒng)計(jì)方法的需要à可以不做四、怎么做?正態(tài)分布分布的特征:1. 對稱性à偏度(正偏、對稱、負(fù)偏)三階 偏度系數(shù) g1 態(tài)峰à翹度(正態(tài)峰、尖峭峰、平闊峰)四階 峰度系數(shù) g2方差齊性檢驗(yàn)一、為什么?1. t檢驗(yàn) F檢驗(yàn) 使用條件的要求2. 方差的抽樣波動二、定義說明變量值的變異度有無差別,或者通過樣本信息來推斷總體方差是否相等的一類檢驗(yàn)方法三、何時做?1. 說明變量值的變異度有無差別時à一定做2. 為滿足t、F檢驗(yàn)方差齊性要求的à可不做四、如何做?多個方差的齊性檢驗(yàn)

17、X2檢驗(yàn)變量變換意義:通過改變觀察值的原初形式,使資料正太化,達(dá)到方差齊性的要求,以滿足t檢驗(yàn)及方差分析的應(yīng)用條件依據(jù):只改變觀察值的分布形式,而不是其相對大小常用方法:1) 對數(shù)變換:以觀察值x的對數(shù)值作為新的分析數(shù)據(jù)常用方式 適用場合:1. 使服從對數(shù)正態(tài)分布的資料正態(tài)化2. 使方差達(dá)到方差齊性要求,特別是標(biāo)準(zhǔn)差與均數(shù)的比值接近時3. 使指數(shù)曲線直線化,常用于曲線擬合2) 平方根變換:以原觀察值x的平方根作為新的分析數(shù)據(jù)常用方式適用場合:1. 使服從Poisson分布的計(jì)數(shù)資料或輕度偏態(tài)資料正態(tài)化2. 使各樣本的方差與均數(shù)的正比例關(guān)系消除或削弱,達(dá)到方差齊性要求3) 百分?jǐn)?shù)、平方根、正反弦

18、變換以原觀察值用百分?jǐn)?shù)表示,平方根反正弦值作為新的分析數(shù)據(jù)適用場合:總體百分?jǐn)?shù)小于30%或大于70%的情形計(jì)數(shù)資料的統(tǒng)計(jì)描述和推斷相對數(shù)(一)為什么引入絕對數(shù)不能做進(jìn)一步分析(二)什么是相對數(shù)同一基礎(chǔ)上,兩個有聯(lián)系指標(biāo)之比*常用指標(biāo)1. 率/頻率指標(biāo):用以說明某現(xiàn)象發(fā)生的頻率與強(qiáng)度計(jì)算比例基數(shù)依習(xí)慣而用 使算的的率至少保留1-2位整數(shù)2. 構(gòu)成比/構(gòu)成指標(biāo):用以說明某一事物內(nèi)部各組成部分所占的比重或分布總和為100%計(jì)算*若總和不為100%:超減于大,低加在小3. 相對比:兩個有關(guān)同類指標(biāo)之比,用以說明兩者的對比水平計(jì)算 *指標(biāo)可為平均數(shù)、絕對數(shù)、相對數(shù)4. 動態(tài)數(shù)列:一系列按時間順序排列起來

19、的統(tǒng)計(jì)指標(biāo),用以說明事物延時間發(fā)展的變化與趨勢*指標(biāo)可為平均數(shù)、絕對數(shù)、相對數(shù)*動態(tài)分析:(1)絕對增量=統(tǒng)計(jì)期指標(biāo)基期指標(biāo)說明事物在一定時期增加的絕對數(shù)量可分為逐年的、逐期的:后比前,內(nèi)部波動累計(jì)的:基期固定,總體結(jié)果(2) 發(fā)展速度、增長速度:反映事物在一定時期的速度變化,可分為定基與環(huán)基發(fā)展速度=統(tǒng)計(jì)期指標(biāo)/基期指標(biāo)增長速度=發(fā)展速度1(三)應(yīng)用相對數(shù)應(yīng)注意的問題1. 計(jì)算相對數(shù)的分母一般不宜過小,對于動物實(shí)驗(yàn),可減小2. 分析時不能以比代率3. 計(jì)算觀察單位不等的幾個率的平均值時,不能直接相加求平均4. 資料的對比應(yīng)注意可比性5. 率和構(gòu)成比也可有抽樣誤差假設(shè)檢驗(yàn)二項(xiàng)分布及其應(yīng)用(一)

20、概念及其應(yīng)用條件對于某個性狀,常常可以把其資料分成兩個類型。即“非此即彼”兩種情況,彼此構(gòu)成對立事件,我們把這種“非此即彼”事件所構(gòu)成的總體,稱為二項(xiàng)總體,其概率分布稱為二項(xiàng)分布。1. 二項(xiàng)分布的概率密度函數(shù):重復(fù)做n次相互獨(dú)立的實(shí)驗(yàn),每次實(shí)驗(yàn)有相互獨(dú)立的結(jié)果,P(A)= P(A)=1-,則n次實(shí)驗(yàn)中A恰好發(fā)生x次的概率2. 實(shí)驗(yàn)有,則可用二項(xiàng)分布處理3. 分布函數(shù)4. 特征:=0.5 對稱,正態(tài)0.30.7 近似對稱,近似正態(tài)>0.7 或 <0.3 偏態(tài)嚴(yán)重,離0.5越遠(yuǎn),偏的越厲害二項(xiàng)分布近似正態(tài)分布的條件:1) ,1- 均大于0.01 à 不接近0或12) n,n(

21、1-) 均大于5à n足夠大5. 二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差、(二)二項(xiàng)分布的應(yīng)用1.總體率的可信區(qū)間(1) 點(diǎn)估計(jì)(2) 區(qū)間估計(jì)1) 查表法2) 正態(tài)近似法(條件)2. 樣本率與已知總體率比較的假設(shè)檢驗(yàn)(1) 直接計(jì)算概率法利用二項(xiàng)分布的概率密度和分布函數(shù),求出p值,與所用的檢驗(yàn)水準(zhǔn)進(jìn)行比較,做出統(tǒng)計(jì)推斷適用條件:偏離0.5較遠(yuǎn),x較?。?) 正態(tài)近似法(條件)(3) 兩個樣本率比較的u檢驗(yàn)(條件)Poisson分布及其應(yīng)用(一)概念及應(yīng)用條件是二項(xiàng)分布的一個特例,當(dāng)或1-很?。?lt;0.05)而n很大時,二項(xiàng)分布近似于Poisson分布常用于研究單位時間或單位面積或容積內(nèi),某罕見

22、事件發(fā)生次數(shù)的分布1. 概率密度函數(shù):2. 應(yīng)用條件:同二項(xiàng)分布3. 分布函數(shù)4. 特點(diǎn):X 離散型分布,適用于計(jì)數(shù)資料X 二項(xiàng)分布的特例,應(yīng)用條件同二項(xiàng)分布X 方差等于均數(shù),=X 20時,Poission分布近似正態(tài)分布X Poisson分布具有可加性(二)應(yīng)用1. 總體均數(shù)的估計(jì)(區(qū)間)1) 查表法 x502) 正態(tài)近似法2. 樣本均數(shù)與總體均數(shù)的比較1) 直接計(jì)算概率法2) 正態(tài)近似法3. 兩個樣本均數(shù)的比較à u檢驗(yàn)1) 兩個樣本觀察單位數(shù)相等2) 兩樣本單位不同時X2檢驗(yàn)及其應(yīng)用同性質(zhì)、適合性、獨(dú)立性檢驗(yàn)一、 X2分布1. X2變量個標(biāo)準(zhǔn)正態(tài)變量平方和2. 概率密度函數(shù)3.

23、 分布函數(shù)4. X2介值表5. X2分布與正態(tài)分布的關(guān)系隨著自由度的增加 卡方分布近似于正態(tài)分布當(dāng)=1時,二、X2檢驗(yàn)的基本思想在實(shí)際操作中,k個實(shí)際頻數(shù)ki 與其相應(yīng)的理論頻數(shù)T 的差值 i=1kAi-Ti2Ti表示實(shí)際頻數(shù)與理論頻數(shù)的吻合程度*當(dāng)n>40,Ti>5時,上式近似X2*可以利用X2值檢驗(yàn)實(shí)際頻數(shù)與按假設(shè)檢驗(yàn)計(jì)算的理論頻數(shù)是否相等的問題*如果假設(shè)成立,那X2 0;不應(yīng)出現(xiàn)大X2的概率P<,如果出現(xiàn),則可以懷疑假設(shè)是否成立,進(jìn)而拒絕他,反之不拒絕X2的基本公式X2=A-T2T n>40,T>5TRC=nRnCnTmin=nRminnCminn=R-1C

24、-1四格表資料處理陽性數(shù)陰性數(shù)合計(jì)陽性率1aba+b2cdc+d合計(jì)a+cb+dnX2基本公式的專用公式X2=ad-bc2na+bc+da+cb+d n>40,T>5X2校正公式X2=A-T-0.52T n>40,1<T<5X2校正公式的專用公式X2=ad-bc-n22na+bc+da+cb+d n>40,1<T<5四格表的確切概率法P=a+b!c+d!a+c!b+d!N!a!b!c!d! n<40 或 T<1配對計(jì)數(shù)資料的X2檢驗(yàn)甲處理乙處理合計(jì)+-+aba+b-cdc+d合計(jì)a+cb+dn1) 兩種處理有誤差別X2=b-c-12b

25、+c b+c>40時可不校正2) 兩種處理有無相關(guān)(雙向有序列聯(lián)表)X2=ad-bc-n22a+bc+da+cb+dR×C 列聯(lián)表X2檢驗(yàn)基本數(shù)據(jù)中多于四格表用途:1. 多個樣本率的比較2. 樣本構(gòu)成比的比較(三個以上)3. 計(jì)數(shù)資料的相關(guān)分析基本思想、基本公式、自由度的計(jì)算同前X2=A2nRnC-1應(yīng)用條件:1.n>402.1<T<5的格子數(shù)不能超過總格子數(shù)的1/53.不能有T<1的格子T過小的處理:1. 增大樣本含量n2. 合并相應(yīng)的行或列3. 刪除相應(yīng)的行或列*多個樣本率/構(gòu)成比的比較,結(jié)論為拒絕H0時,認(rèn)為有差別,但不知其具體,應(yīng)兩兩比較*如果分

26、組標(biāo)志是雙因素的,若其中一組分組標(biāo)志有序à單向有序列聯(lián)表。若分析構(gòu)成比àX2檢驗(yàn),否則用秩和檢驗(yàn)(一)多個樣本率的比較(k×2表)(二)兩個樣本構(gòu)成比的比較(可推多個)(2×k表)(三)計(jì)數(shù)資料的相關(guān)分析(雙向有序列聯(lián)表)頻數(shù)分布擬合優(yōu)度的X2檢驗(yàn)判定樣本頻數(shù)分布是否符合某一理論P(yáng)i=Fu2-Fu1=Fx2-x1-=行-1非參數(shù)統(tǒng)計(jì)*不依賴于總體的分布形式,應(yīng)用時忽略分布類型是否已知*檢驗(yàn)時比較分布而非參數(shù)*適用范圍廣,不受分布形式限制*可用于不能活未能精確測量的資料,尤其適用等級資料或適合于算中位數(shù)*前提為變量變換后仍不能達(dá)到正態(tài)缺點(diǎn):檢驗(yàn)效能低=參數(shù)

27、統(tǒng)計(jì)×30%適用場合:等級資料偏態(tài)分布(經(jīng)變換后不能正態(tài),近似L型)開口資料分布不清的方差不齊(經(jīng)變換后仍不能達(dá)到齊性)常用方法:符號檢驗(yàn) 秩和檢驗(yàn) 超越檢驗(yàn) 游程檢驗(yàn) 等級相關(guān)分析秩和檢驗(yàn)(一) 配對比較的符號秩和檢驗(yàn)(二) 兩個樣本比較的秩和檢驗(yàn)(三) 多個樣本比較的秩和檢驗(yàn)(四) 多個樣本兩兩比較的秩和檢驗(yàn)àt檢驗(yàn)相關(guān)與回歸分析直線相關(guān)一、 概念1. 兩變量間的關(guān)系2. 直線相關(guān)分析:找出一個適當(dāng)?shù)闹笜?biāo)來描述兩個變量間的直線相關(guān)關(guān)系、相關(guān)密切程度及方向是怎樣的3. 適用條件:雙變量正態(tài)分布或正態(tài)雙變量二、 相關(guān)系數(shù)(指標(biāo))1. 定義:描述兩個變量間有無直線變量關(guān)系及密

28、切程度樣本àr 總體à2. 意義:通過取值描述不同的相關(guān)情形3. 相關(guān)系數(shù)的計(jì)算4. r=0 推出 =0 à r的假設(shè)檢驗(yàn)à t檢驗(yàn)等級相關(guān)用等級數(shù)據(jù)做直線相關(guān)分析適用場合:1.不服從雙變量正態(tài)分布的2.總體分布型未知的3.原始數(shù)據(jù)使用等級表示的等級相關(guān)系數(shù):表明兩變量間的相關(guān)密切程度樣本rs 總體srs的檢驗(yàn):1.查表法 2.t檢驗(yàn)直線回歸一、概念研究兩變量在數(shù)量上的依存關(guān)系直線回歸方程 y=a+bx+*用容易測量的變量推算不易測得的變量*對資料的要求:1.正態(tài)雙變量:x à y & y à x 的兩個方程(不同)2.至少有

29、一個是正態(tài)變量,必須是yà要求x是精確測定的二、直線回歸方程1.一般表達(dá)式*數(shù)學(xué)模型:Y=a+bx+*一般表達(dá)式:2.系數(shù)a、b的求法三、 直線回歸方程的圖示四、 回歸系數(shù)的假設(shè)檢驗(yàn)1. 方差分析(F檢驗(yàn))2. 回歸系數(shù)b的t檢驗(yàn)五、 回歸方程的應(yīng)用1. 描述兩變量間的依存關(guān)系2. 以容易測得的變量去推測不易測得的變量3. 利用回歸方程進(jìn)行預(yù)測預(yù)報(一個區(qū)間)把變量x帶入回歸方程中去估計(jì)Y4. 利用直線回歸方程進(jìn)行控制六、 應(yīng)用注意1. 要有實(shí)際意義2. 資料要符合要求3. 自變量和因變量的選擇要符合實(shí)際4. 直線回歸的范圍只限于取得原始資料的范圍5. 直線回歸方程可以內(nèi)插,一般不能外延6. 回歸方程必須經(jīng)過檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論