版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)分析的原那么
PrinciplesofstatisticalanalysisAdistinctivefunctionofstatisticsisthis:itenablesthescientisttomakeanumericalevaluationoftheuncertaintyofhisconclusion.--Snedecor(1950)統(tǒng)計(jì)分析的原那么
Principlesofstatist1引言統(tǒng)計(jì)分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中去。SamplePopulation利用均數(shù)、標(biāo)準(zhǔn)差;百分構(gòu)成/率;圖表等進(jìn)展描述。不同處理組間的比較。樣本結(jié)論〔統(tǒng)計(jì)量〕能否代表總體〔參數(shù)〕?統(tǒng)計(jì)分析的兩個(gè)根本工具—估計(jì)Estimation和假設(shè)檢驗(yàn)HypothesisTest引言統(tǒng)計(jì)分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中2統(tǒng)計(jì)學(xué)的一個(gè)重要思想如何說明從樣本中得出的結(jié)果是對總體的最好的估計(jì)〔Estimate〕?例1:服用A藥的病人63%得到緩解,而服用B藥的病人只有53%。A藥的療效比B藥好10%?!睵=0.15〕例2:服用A藥的病人56%得到完全緩解,而服用B藥的病人只有36%。A藥的療效比B藥好18%?!睵<0.01〕統(tǒng)計(jì)學(xué)的一個(gè)重要思想如何說明從樣本中得出的結(jié)果是對總體的最好3抽樣變異SamplingVariation抽樣變異SamplingVariation4樣本均數(shù)的變異Variabilityofsamplemeans性質(zhì)
1.較大樣本的均數(shù)的變異小于較小樣本的均數(shù)的變異
2.樣本均數(shù)的變異小于觀測值的變異
3.樣本均數(shù)的變異隨觀測值變異的增大而增大樣本均數(shù)的變異Variabilityofsamplem5隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistribution從一個(gè)總體中隨機(jī)地、不斷地抽出樣本大小一樣的樣本,這些樣本具有如下性質(zhì):1.樣本均數(shù)/方差的期望=總體均數(shù)/方差2.樣本均數(shù)的均數(shù)=總體均數(shù)
樣本均數(shù)的方差=總體方差/樣本量
樣本均數(shù)的標(biāo)準(zhǔn)差-標(biāo)準(zhǔn)誤
標(biāo)準(zhǔn)誤的估計(jì)3.如果總體為正態(tài)分布,那么樣本均數(shù)的分布也是正態(tài)分布。如果樣本量足夠大,那么即使總體不是正態(tài)分布,樣本均數(shù)的分布也近似正態(tài)分布—中心極限定理〔CentralLimitedTheorem〕。隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistr6對抽樣分布的補(bǔ)充說明在實(shí)際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對稱的分布,就可以認(rèn)為其均數(shù)的分布服從正態(tài)或接近于正態(tài)。在實(shí)際應(yīng)用中,只要樣本量足夠大,那么不管數(shù)據(jù)呈何種分布,都可以將其均數(shù)的分布當(dāng)作正態(tài)分布來處理。隨機(jī)樣本的均數(shù)的分布的第1條性質(zhì)和第3條性質(zhì)同樣適用于樣本的百分構(gòu)成〔如二項(xiàng)分布〕。但是由于這類數(shù)據(jù)所代表的顯然不是正態(tài)總體,所以只有在樣本量相當(dāng)大時(shí)才可以應(yīng)用性質(zhì)1和3。對抽樣分布的補(bǔ)充說明在實(shí)際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對7記號Notations記號Notations8理解抽樣分布理解抽樣分布9計(jì)算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清白蛋白服從均數(shù)35g/l標(biāo)準(zhǔn)差6g/l的正態(tài)分布?,F(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個(gè)考察它們的均數(shù)的分布。
理論上,均數(shù)的均數(shù)均應(yīng)該等于35,均數(shù)的標(biāo)準(zhǔn)差應(yīng)該分別等于計(jì)算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原10Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清膽紅素服從均數(shù)3.6mol/l標(biāo)準(zhǔn)差1.1mol/l的對數(shù)正態(tài)分布。現(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個(gè)考察它們的均數(shù)的分布。二項(xiàng)分布的抽樣分布
例:假設(shè)哮喘在人群中的患病率為20%,現(xiàn)隨機(jī)抽取樣本量為10、25、100的樣本各100個(gè)考察哮喘患者數(shù)的分布。Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原11一個(gè)樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofasamplemean例:216名原發(fā)性膽石癥患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l。假設(shè)服從正態(tài)分布并且此樣本為一隨機(jī)樣本,試問如何用此樣本的均數(shù)來對總體的均數(shù)進(jìn)展估計(jì)呢?一個(gè)樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofa12兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorofthedifferencebetweentwosamplemeans因?yàn)閮蓸颖揪鶖?shù)之差的方差等于兩樣本各自均數(shù)的方差之和,所以:兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorof13一個(gè)樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorofasampleproportion理論上,當(dāng)np>5時(shí),二項(xiàng)分布的百分構(gòu)成p近似地服從均數(shù)為p,標(biāo)準(zhǔn)差為的正態(tài)分布。即樣本百分構(gòu)成p的標(biāo)準(zhǔn)誤為:例:觀察到80名婦女中有13名患有哮喘,那么哮喘的百分構(gòu)成p為13/80=0.16,其標(biāo)準(zhǔn)誤為:一個(gè)樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorof14兩個(gè)樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個(gè)樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,因?yàn)閮蓚€(gè)樣本的百分構(gòu)成之差的方差等于兩個(gè)樣本各自的百分構(gòu)成的方差的和,所以兩個(gè)樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤的計(jì)算為:兩個(gè)樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個(gè)樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,15可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕16可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕17理解可信區(qū)間理解可信區(qū)間18假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證思想
兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis〔H0〕
意在推翻的假設(shè)〔說法A〕。備擇假設(shè)Alternativehypothesis〔H1〕
意在承受的假設(shè)〔說法B〕。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證思19小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗(yàn)〔抽樣〕時(shí),我們往往認(rèn)為它〔事件A〕不會發(fā)生。統(tǒng)計(jì)學(xué)中,小概率事件一般是指發(fā)生概率<0.05〔檢驗(yàn)水準(zhǔn)〕的事件。在假設(shè)檢驗(yàn)中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們那么疑心無效假設(shè)的真實(shí)性。小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗(yàn)〔抽樣20例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處理結(jié)果B
效果Effect:=結(jié)果A-結(jié)果B對于總體
如果=0,那么A處理和B處理之間沒有差異。
如果0,那么A處理和B處理之間有差異。對于樣本
即使=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個(gè)差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處21對本例進(jìn)展假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計(jì)算出得到樣本差異或者更大差異的概率〔P值〕。如果P值小于檢驗(yàn)水準(zhǔn),那么我們認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,承受備擇假設(shè)〔差異顯著性〕。反之對本例進(jìn)展假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅22方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。由此假設(shè),。那么有包含95%的,同樣地,包含總體均數(shù)0的可能性是95%。換句話說,不包含總體均數(shù)0的可能性是5%。利用可信區(qū)間推翻無效假設(shè)
一旦發(fā)現(xiàn)沒有包含總體均數(shù)0,我們那么認(rèn)為無效假設(shè)是不對的。即樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的。樣本結(jié)果A和B之間的差異有顯著性。方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽23方法二:利用檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建〔在無效假設(shè)的前提下〕
檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗(yàn)統(tǒng)計(jì)量一般服從某種分布。這樣我們就可以利用這種分布計(jì)算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。方法二:利用檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建〔在無效假設(shè)的前提下〕24在繼續(xù)進(jìn)展之前在繼續(xù)進(jìn)展之前25界值對應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.051.645或-1.645雙側(cè)0.051.96和-1.96一樣檢驗(yàn)水準(zhǔn),單側(cè)檢驗(yàn)界值外的概率是雙側(cè)檢驗(yàn)的2倍界值對應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些26堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用。未服藥時(shí)成年男性的堿性磷酸酶的均值為60U/l,標(biāo)準(zhǔn)差為15U/l。現(xiàn)觀察到100名服藥后的成年男性的堿性磷酸酶的均值為62U/l,問該藥物是否有提高成年男性堿性磷酸酶的作用?無效假設(shè):備擇假設(shè):檢驗(yàn)統(tǒng)計(jì)量:拒絕無效假設(shè)的區(qū)間:單側(cè)=0.05,如果Z>1.645那么拒絕。結(jié)論:由于1.33<1.645,不拒絕無效假設(shè)。尚無足夠證據(jù)證明該藥有提高成年男性堿性磷酸酶的作用。堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用27血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.5g/l?,F(xiàn)有216名患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l,問此樣本是否來自于上面的總體?
無效假設(shè)H0:此樣本來自于上面的總體或者說此樣本代表的總體與上面的總體一樣。10備擇假設(shè)H1:此樣本不來自于上面的總體或者說此樣本代表的總體與上面的總體不同。10檢驗(yàn)水準(zhǔn):雙側(cè)0.05血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.28理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是
一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)的差、
一個(gè)樣本的百分構(gòu)成、兩個(gè)樣本百分構(gòu)成的差檢驗(yàn)統(tǒng)計(jì)量所服從的分布不一定是正態(tài)分布。但只要是的理論分布,都可以通過該分布求得P值。理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是
一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)29理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小〞,一般的,我們是根據(jù)事先確定的檢驗(yàn)水準(zhǔn)來判斷的。當(dāng)P<時(shí),我們就可以下諸如“差異有顯著性〞的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端30當(dāng)P>時(shí)非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)缺乏。具體問題,專業(yè)判斷
P=0.70與P=0.07當(dāng)P>時(shí)非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔31“差異有顯著性〞與“差異顯著〞類似地,還有“差異有高度顯著性〞與“差異極為顯著〞二者之間不存在必然的聯(lián)系。“差異顯著〞不一定導(dǎo)致“差異有顯著性〞,“差異不顯著〞倒是有很大可能導(dǎo)致“差異有顯著性〞。即使“差異有顯著性〞,臨床上也不一定有意義。“差異有顯著性〞與“差異顯著〞類似地,還有“差異有高度顯著性32I型錯誤與II型錯誤
TypeIandTypeIIerrors盡管是小概率事件,它還是有可能發(fā)生的。I型錯誤:雖然無效假設(shè)為真,但由于抽到了較大〔檢驗(yàn)統(tǒng)計(jì)量〕的樣本,使得P值小于檢驗(yàn)水準(zhǔn)而導(dǎo)致被拒絕。是否為小概率事件是由檢驗(yàn)水準(zhǔn)而定,所以犯錯誤的概率也由檢驗(yàn)水準(zhǔn)而定。II型錯誤:雖然無效假設(shè)為假,但由于抽到了較小〔檢驗(yàn)統(tǒng)計(jì)量〕的樣本,使得P值大于檢驗(yàn)水準(zhǔn)而導(dǎo)致不被拒絕。犯II型錯誤的概率由另一水準(zhǔn)而定。I型錯誤與II型錯誤
TypeIandTypeII33單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)?
One-sidedortwo-sidedtest?雙側(cè)檢驗(yàn)永遠(yuǎn)是正確的單側(cè)檢驗(yàn)只有在少數(shù)情況下才是適宜的即使要做單側(cè)檢驗(yàn),也必須事先確定單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)?
One-sidedortwo-s34非參數(shù)方法Non-parametricmethods估計(jì)和假設(shè)檢驗(yàn)都是基于某種分布來進(jìn)展的,它們之間有著很密切的聯(lián)系。由于分布都可以用某些參數(shù)來描述〔特別是均數(shù)和標(biāo)準(zhǔn)差〕,所以基于分布的統(tǒng)計(jì)分析方法又被稱為參數(shù)方法。與此不同的是,統(tǒng)計(jì)學(xué)中還存在著另外一類不基于分布的分析方法,這類方法稱為非參數(shù)方法。廣義的,非參數(shù)方法是用來分析那些不適合用參數(shù)方法分析的數(shù)據(jù)〔常見的是嚴(yán)重偏態(tài)的數(shù)據(jù)、等級數(shù)據(jù)〕。最常見的非參數(shù)方法是利用數(shù)據(jù)的順位〔而非數(shù)據(jù)本身〕來進(jìn)展。非參數(shù)方法Non-parametricmethods估計(jì)和35統(tǒng)計(jì)建模StatisticalModelling在估計(jì)和假設(shè)檢驗(yàn)的思想背后有一個(gè)統(tǒng)計(jì)分析的一般策略稱為建模。一個(gè)統(tǒng)計(jì)模型是一個(gè)可以近似描述兩個(gè)或多個(gè)變量之間關(guān)系的數(shù)學(xué)式。這種方法可以簡化數(shù)據(jù)的分析。大多數(shù)參數(shù)方法都可以歸為一個(gè)被稱為“線性模型〞的統(tǒng)一框架,其中線性的意思為“可加的〞。其根本思想在于所關(guān)心指標(biāo)的變異可以由許多影響因子的相加的效果來進(jìn)展解釋。例如:血壓值的大小是由年齡、性別、是否吸煙的效果相加而來。統(tǒng)計(jì)建模StatisticalModelling在估計(jì)和假36關(guān)于統(tǒng)計(jì)建模的兩個(gè)根本思想統(tǒng)計(jì)建模一般基于某些假設(shè),所以在建模之前對這些假設(shè)的驗(yàn)證是非常重要的。在建好模型之后,我們也要從兩個(gè)方面對模型的好壞進(jìn)展評價(jià)。
第一是對模型的擬合度進(jìn)展評價(jià)??纯从赡P蛿M合的數(shù)據(jù)是否接近樣本數(shù)據(jù),擬合數(shù)據(jù)與樣本數(shù)據(jù)之間的差是否呈隨機(jī)分布。
第二是評價(jià)模型在用于預(yù)測更廣范圍的數(shù)據(jù)時(shí),其可靠性如何。關(guān)于統(tǒng)計(jì)建模的兩個(gè)根本思想統(tǒng)計(jì)建模一般基于某些假設(shè),所以在建37區(qū)間估計(jì)還是假設(shè)檢驗(yàn)?假設(shè)檢驗(yàn)盡管有用,但只能反映數(shù)據(jù)信息的一局部。區(qū)間估計(jì)反映〔對總體特征〕估計(jì)的不確定程度,能更全面地把握數(shù)據(jù)??尚艆^(qū)間與假設(shè)檢驗(yàn)的互通性
如果95%可信區(qū)間不包含總體均數(shù),那么假設(shè)檢驗(yàn)中P值一定小于0.05反之,如果95%可信區(qū)間包含總體均數(shù),那么P值一定大于0.05。99%可信區(qū)間同理。區(qū)間估計(jì)還是假設(shè)檢驗(yàn)?假設(shè)檢驗(yàn)盡管有用,但只能反映數(shù)據(jù)信息的38小結(jié)理解統(tǒng)計(jì)分析的根本思想至關(guān)重要。樣本均數(shù)/樣本百分構(gòu)成的抽樣分布理論。中心極限定理。估計(jì)〔主要是區(qū)間估計(jì)〕和假設(shè)檢驗(yàn)是統(tǒng)計(jì)分析的兩個(gè)重要工具。P值的理解與解釋?!安町愑酗@著性〞與“有顯著差異〞不能混為一談?!安町愑酗@著性〞也不代表臨床上有意義。小結(jié)理解統(tǒng)計(jì)分析的根本思想至關(guān)重要。39統(tǒng)計(jì)分析的原那么
PrinciplesofstatisticalanalysisAdistinctivefunctionofstatisticsisthis:itenablesthescientisttomakeanumericalevaluationoftheuncertaintyofhisconclusion.--Snedecor(1950)統(tǒng)計(jì)分析的原那么
Principlesofstatist40引言統(tǒng)計(jì)分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中去。SamplePopulation利用均數(shù)、標(biāo)準(zhǔn)差;百分構(gòu)成/率;圖表等進(jìn)展描述。不同處理組間的比較。樣本結(jié)論〔統(tǒng)計(jì)量〕能否代表總體〔參數(shù)〕?統(tǒng)計(jì)分析的兩個(gè)根本工具—估計(jì)Estimation和假設(shè)檢驗(yàn)HypothesisTest引言統(tǒng)計(jì)分析的目的
把從樣本中得到的結(jié)論推廣到〔同質(zhì)〕總體中41統(tǒng)計(jì)學(xué)的一個(gè)重要思想如何說明從樣本中得出的結(jié)果是對總體的最好的估計(jì)〔Estimate〕?例1:服用A藥的病人63%得到緩解,而服用B藥的病人只有53%。A藥的療效比B藥好10%。〔P=0.15〕例2:服用A藥的病人56%得到完全緩解,而服用B藥的病人只有36%。A藥的療效比B藥好18%?!睵<0.01〕統(tǒng)計(jì)學(xué)的一個(gè)重要思想如何說明從樣本中得出的結(jié)果是對總體的最好42抽樣變異SamplingVariation抽樣變異SamplingVariation43樣本均數(shù)的變異Variabilityofsamplemeans性質(zhì)
1.較大樣本的均數(shù)的變異小于較小樣本的均數(shù)的變異
2.樣本均數(shù)的變異小于觀測值的變異
3.樣本均數(shù)的變異隨觀測值變異的增大而增大樣本均數(shù)的變異Variabilityofsamplem44隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistribution從一個(gè)總體中隨機(jī)地、不斷地抽出樣本大小一樣的樣本,這些樣本具有如下性質(zhì):1.樣本均數(shù)/方差的期望=總體均數(shù)/方差2.樣本均數(shù)的均數(shù)=總體均數(shù)
樣本均數(shù)的方差=總體方差/樣本量
樣本均數(shù)的標(biāo)準(zhǔn)差-標(biāo)準(zhǔn)誤
標(biāo)準(zhǔn)誤的估計(jì)3.如果總體為正態(tài)分布,那么樣本均數(shù)的分布也是正態(tài)分布。如果樣本量足夠大,那么即使總體不是正態(tài)分布,樣本均數(shù)的分布也近似正態(tài)分布—中心極限定理〔CentralLimitedTheorem〕。隨機(jī)樣本的均數(shù)的分布—
抽樣分布SamplingDistr45對抽樣分布的補(bǔ)充說明在實(shí)際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對稱的分布,就可以認(rèn)為其均數(shù)的分布服從正態(tài)或接近于正態(tài)。在實(shí)際應(yīng)用中,只要樣本量足夠大,那么不管數(shù)據(jù)呈何種分布,都可以將其均數(shù)的分布當(dāng)作正態(tài)分布來處理。隨機(jī)樣本的均數(shù)的分布的第1條性質(zhì)和第3條性質(zhì)同樣適用于樣本的百分構(gòu)成〔如二項(xiàng)分布〕。但是由于這類數(shù)據(jù)所代表的顯然不是正態(tài)總體,所以只有在樣本量相當(dāng)大時(shí)才可以應(yīng)用性質(zhì)1和3。對抽樣分布的補(bǔ)充說明在實(shí)際應(yīng)用中,只要樣本數(shù)據(jù)呈單峰、大致對46記號Notations記號Notations47理解抽樣分布理解抽樣分布48計(jì)算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清白蛋白服從均數(shù)35g/l標(biāo)準(zhǔn)差6g/l的正態(tài)分布?,F(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個(gè)考察它們的均數(shù)的分布。
理論上,均數(shù)的均數(shù)均應(yīng)該等于35,均數(shù)的標(biāo)準(zhǔn)差應(yīng)該分別等于計(jì)算機(jī)模擬Simulation正態(tài)總體的抽樣分布
例:假設(shè)原49Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原發(fā)性膽石癥患者的血清膽紅素服從均數(shù)3.6mol/l標(biāo)準(zhǔn)差1.1mol/l的對數(shù)正態(tài)分布。現(xiàn)從中隨機(jī)抽取樣本量10、25、100的樣本各100個(gè)考察它們的均數(shù)的分布。二項(xiàng)分布的抽樣分布
例:假設(shè)哮喘在人群中的患病率為20%,現(xiàn)隨機(jī)抽取樣本量為10、25、100的樣本各100個(gè)考察哮喘患者數(shù)的分布。Simulation〔續(xù)〕對數(shù)正態(tài)分布的抽樣分布
例:假設(shè)原50一個(gè)樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofasamplemean例:216名原發(fā)性膽石癥患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l。假設(shè)服從正態(tài)分布并且此樣本為一隨機(jī)樣本,試問如何用此樣本的均數(shù)來對總體的均數(shù)進(jìn)展估計(jì)呢?一個(gè)樣本均數(shù)的標(biāo)準(zhǔn)誤
StandardErrorofa51兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorofthedifferencebetweentwosamplemeans因?yàn)閮蓸颖揪鶖?shù)之差的方差等于兩樣本各自均數(shù)的方差之和,所以:兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤
Standarderrorof52一個(gè)樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorofasampleproportion理論上,當(dāng)np>5時(shí),二項(xiàng)分布的百分構(gòu)成p近似地服從均數(shù)為p,標(biāo)準(zhǔn)差為的正態(tài)分布。即樣本百分構(gòu)成p的標(biāo)準(zhǔn)誤為:例:觀察到80名婦女中有13名患有哮喘,那么哮喘的百分構(gòu)成p為13/80=0.16,其標(biāo)準(zhǔn)誤為:一個(gè)樣本百分構(gòu)成的標(biāo)準(zhǔn)誤
StandardErrorof53兩個(gè)樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個(gè)樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,因?yàn)閮蓚€(gè)樣本的百分構(gòu)成之差的方差等于兩個(gè)樣本各自的百分構(gòu)成的方差的和,所以兩個(gè)樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤的計(jì)算為:兩個(gè)樣本百分構(gòu)成的差的標(biāo)準(zhǔn)誤與兩個(gè)樣本均數(shù)的差的標(biāo)準(zhǔn)誤一樣,54可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕55可信區(qū)間ConfidenceInterval〔CI〕可信區(qū)間ConfidenceInterval〔CI〕56理解可信區(qū)間理解可信區(qū)間57假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證思想
兩種說法非A即B。要證明B真,只要證明A偽即可。無效假設(shè)Nullhypothesis〔H0〕
意在推翻的假設(shè)〔說法A〕。備擇假設(shè)Alternativehypothesis〔H1〕
意在承受的假設(shè)〔說法B〕。從無效假設(shè)出發(fā),找出不支持這一假設(shè)的證據(jù),從而推翻它。假設(shè)檢驗(yàn)HypothesisTesting假設(shè)檢驗(yàn)的反證思58小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗(yàn)〔抽樣〕時(shí),我們往往認(rèn)為它〔事件A〕不會發(fā)生。統(tǒng)計(jì)學(xué)中,小概率事件一般是指發(fā)生概率<0.05〔檢驗(yàn)水準(zhǔn)〕的事件。在假設(shè)檢驗(yàn)中,如果在無效假設(shè)的前提下出現(xiàn)了小概率事件,我們那么疑心無效假設(shè)的真實(shí)性。小概率事件事件A發(fā)生的概率是如此之小,以至于在一次試驗(yàn)〔抽樣59例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處理結(jié)果B
效果Effect:=結(jié)果A-結(jié)果B對于總體
如果=0,那么A處理和B處理之間沒有差異。
如果0,那么A處理和B處理之間有差異。對于樣本
即使=0,由于存在抽樣變異,往往樣本結(jié)果A–樣本結(jié)果B=0。問題在于這個(gè)差異是否僅僅是由于抽樣變異造成的?例:兩種不同處理結(jié)果之間的差異效果
A處理結(jié)果A,B處60對本例進(jìn)展假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。備擇假設(shè):樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的,還包含不同處理的效果。即H1:0。由無效假設(shè)出發(fā),我們可以計(jì)算出得到樣本差異或者更大差異的概率〔P值〕。如果P值小于檢驗(yàn)水準(zhǔn),那么我們認(rèn)為由此無效假設(shè)不太可能出現(xiàn)這樣的結(jié)果,從而推翻它,承受備擇假設(shè)〔差異顯著性〕。反之對本例進(jìn)展假設(shè)檢驗(yàn)的思路無效假設(shè):樣本結(jié)果A和B之間的差異僅61方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽樣變異造成的。即H0:=0。由此假設(shè),。那么有包含95%的,同樣地,包含總體均數(shù)0的可能性是95%。換句話說,不包含總體均數(shù)0的可能性是5%。利用可信區(qū)間推翻無效假設(shè)
一旦發(fā)現(xiàn)沒有包含總體均數(shù)0,我們那么認(rèn)為無效假設(shè)是不對的。即樣本結(jié)果A和B之間的差異不僅僅是由于抽樣變異造成的。樣本結(jié)果A和B之間的差異有顯著性。方法一:利用可信區(qū)間假設(shè)樣本結(jié)果A和B之間的差異僅僅是由于抽62方法二:利用檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建〔在無效假設(shè)的前提下〕
檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建是無效假設(shè)的關(guān)鍵。檢驗(yàn)統(tǒng)計(jì)量一般服從某種分布。這樣我們就可以利用這種分布計(jì)算出由無效假設(shè)出發(fā),得到觀察到的差異或更大的差異的概率,從而作出推斷。方法二:利用檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建〔在無效假設(shè)的前提下〕63在繼續(xù)進(jìn)展之前在繼續(xù)進(jìn)展之前64界值對應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些界值:單側(cè)0.051.645或-1.645雙側(cè)0.051.96和-1.96一樣檢驗(yàn)水準(zhǔn),單側(cè)檢驗(yàn)界值外的概率是雙側(cè)檢驗(yàn)的2倍界值對應(yīng)于檢驗(yàn)水準(zhǔn)的分布上的某些數(shù)值。正態(tài)分布上的某些65堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用。未服藥時(shí)成年男性的堿性磷酸酶的均值為60U/l,標(biāo)準(zhǔn)差為15U/l。現(xiàn)觀察到100名服藥后的成年男性的堿性磷酸酶的均值為62U/l,問該藥物是否有提高成年男性堿性磷酸酶的作用?無效假設(shè):備擇假設(shè):檢驗(yàn)統(tǒng)計(jì)量:拒絕無效假設(shè)的區(qū)間:單側(cè)=0.05,如果Z>1.645那么拒絕。結(jié)論:由于1.33<1.645,不拒絕無效假設(shè)。尚無足夠證據(jù)證明該藥有提高成年男性堿性磷酸酶的作用。堿性磷酸酶的例子考察某藥物是否有提高成年男性堿性磷酸酶的作用66血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.5g/l?,F(xiàn)有216名患者的血清白蛋白均數(shù)為34.46g/l,標(biāo)準(zhǔn)差為5.84g/l,問此樣本是否來自于上面的總體?
無效假設(shè)H0:此樣本來自于上面的總體或者說此樣本代表的總體與上面的總體一樣。10備擇假設(shè)H1:此樣本不來自于上面的總體或者說此樣本代表的總體與上面的總體不同。10檢驗(yàn)水準(zhǔn):雙側(cè)0.05血清白蛋白的例子原發(fā)性膽石癥患者的血清白蛋白總體均數(shù)為33.67理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是
一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)的差、
一個(gè)樣本的百分構(gòu)成、兩個(gè)樣本百分構(gòu)成的差檢驗(yàn)統(tǒng)計(jì)量所服從的分布不一定是正態(tài)分布。但只要是的理論分布,都可以通過該分布求得P值。理解檢驗(yàn)統(tǒng)計(jì)量觀察到的量可以是
一個(gè)樣本的均數(shù)、兩個(gè)樣本均數(shù)68理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的概率。P值越小說明無效假設(shè)越不可靠?;蛘哒f,P值越小我們就越有理由推翻無效假設(shè)。至于P值是否屬于“小〞,一般的,我們是根據(jù)事先確定的檢驗(yàn)水準(zhǔn)來判斷的。當(dāng)P<時(shí),我們就可以下諸如“差異有顯著性〞的論斷。P值的大小與觀察到的量的大小之間沒有必然的聯(lián)系。理解P值P值是指在無效假設(shè)的前提下,得到觀察到的量〔或更極端69當(dāng)P>時(shí)非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔或更極端的量〕的可能性還是相當(dāng)大的,我們尚不能拒絕無效假設(shè)或者說拒絕無效假設(shè)的證據(jù)缺乏。具體問題,專業(yè)判斷
P=0.70與P=0.07當(dāng)P>時(shí)非小概率事件
在無效假設(shè)的前提下,得到觀察到的量〔70“差異有顯著性〞與“差異顯著〞類似地,還有“差異有高度顯著性〞與“差異極為顯著〞二者之間不存在必然的聯(lián)系?!安町愶@著〞不一定導(dǎo)致“差異有顯著性〞,“差異不顯著〞倒是有很大可能導(dǎo)致“差異有顯著性〞。即使“差異有顯著性〞,臨床上也不一定有意義?!安町愑酗@著性〞與“差異顯著〞類似地,還有“差異有高度顯著性71I型錯誤與II型錯誤
TypeIandTypeIIerrors盡管是小概率事件,它還是有可能發(fā)生的。I型錯誤:雖然無效假設(shè)為真,但由于抽到了較大〔檢驗(yàn)統(tǒng)計(jì)量〕的樣本,使得P值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同zao的法律認(rèn)定
- 合同法第115條內(nèi)容
- 統(tǒng)考版2025屆高考?xì)v史一輪復(fù)習(xí)課后限時(shí)集訓(xùn)39新文化運(yùn)動與馬克思主義的傳播含解析新人教版
- 2024年山東客運(yùn)從業(yè)資格證應(yīng)用能力考試
- 2024最高額質(zhì)押反擔(dān)保合同
- 2024購房合同能否更名以及如何更名
- 專題10.人物描寫及其作用-2023年三升四語文暑期閱讀專項(xiàng)提升(統(tǒng)編版)
- 四年級讀書卡完整版
- 三年級語文上冊第五單元測試卷-基礎(chǔ)知識與綜合能力篇 含答案 部編版
- 2024成品柴油買賣合同
- 2024年地下水監(jiān)測打井施工合同
- 2023年江門市基層公共就業(yè)創(chuàng)業(yè)服務(wù)崗位招聘考試真題
- 圖解《黑神話悟空》微課件
- 期中模擬測試卷3(試題)-2024-2025學(xué)年三年級上冊數(shù)學(xué)(福建)
- 電子產(chǎn)品回收處理協(xié)議
- 礦石交易居間合同模板
- 期中測試卷(試題)-2024-2025學(xué)年人教版數(shù)學(xué)四年級上冊
- LNG(天然氣)供氣站(氣化站)安全應(yīng)急救援預(yù)案
- 信息技術(shù)咨詢服務(wù)合同5篇
- 衛(wèi)生紙購銷合同書
- 16G362鋼筋混凝土結(jié)構(gòu)預(yù)埋件(詳細(xì)書簽)圖集
評論
0/150
提交評論