醫(yī)學(xué)統(tǒng)計學(xué)全科_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)全科_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)全科_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)全科_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)全科_第5頁
已閱讀5頁,還剩117頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計學(xué)閆世艷2011-4-18緒論

為什么醫(yī)學(xué)科研工作離不開統(tǒng)計學(xué)?什么是醫(yī)學(xué)統(tǒng)計學(xué)?運(yùn)用概率論、數(shù)理統(tǒng)計學(xué)的原理與方法,研究醫(yī)學(xué)領(lǐng)域中隨機(jī)現(xiàn)象有關(guān)數(shù)據(jù)的搜集、整理、分析與推斷,進(jìn)而闡明其客觀規(guī)律性的一門應(yīng)用科學(xué)。01隨機(jī)現(xiàn)象(事件)--變異02必然現(xiàn)象(事件)03“若無變異,無需統(tǒng)計”醫(yī)學(xué)統(tǒng)計學(xué)的研究對象01研究設(shè)計:專業(yè)設(shè)計、統(tǒng)計設(shè)計03整理資料05結(jié)論02研究實(shí)施—收集資料04分析資料醫(yī)學(xué)研究的基本流程STEP1STEP2STEP3STEP4統(tǒng)計學(xué)是工具,是為醫(yī)學(xué)科研服務(wù)的;需要與臨床專家相互協(xié)作。沒有好的研究設(shè)計,再好的統(tǒng)計方法都無濟(jì)于事。統(tǒng)計學(xué)是在搜集、整理、分析和解釋大量數(shù)據(jù)的過程中完成使命的?!把芯拷Y(jié)束之后,再找統(tǒng)計學(xué)家,相當(dāng)于進(jìn)行尸體解剖,他能告訴你的只能是試驗失敗的原因”—RA,F(xiàn)isher統(tǒng)計學(xué)在醫(yī)學(xué)科研中的地位統(tǒng)計學(xué)的基本概念同質(zhì)與變異總體與樣本概率與頻率變量個體誤差同質(zhì):觀察單位間被研究指標(biāo)的影響因素相同。變異:同質(zhì)總體中,不同個體間的差異。同質(zhì):研究事物現(xiàn)象存在的共性,是統(tǒng)計學(xué)的基礎(chǔ)。010203同質(zhì)與變異個體:觀察單位,統(tǒng)計研究中的最基本單位??傮w:根據(jù)研究目的確定的同質(zhì)個體構(gòu)成總體有限總體:有時間、空間、人群范圍的限制無限總體:無時間、空間的限制樣本:從總體中隨機(jī)抽取的部分個體,構(gòu)成樣本。0102總體與樣本1頻率:在相同條件下,重復(fù)n次試驗,某隨機(jī)事件A發(fā)生的次數(shù)X與n次試驗的比值,即為該事件發(fā)生的頻率。2Buffon4040次硬幣2048次正面頻率:0.50693概率:某隨機(jī)事件發(fā)生可能性大小的度量。用P表示。上述試驗,當(dāng)n逐漸增大時,頻率始終在一個常數(shù)左右微小波動,這個常數(shù)就是概率。4扔硬幣的試驗中,出現(xiàn)正面的概率為0.50.5小概率事件,P≤0.05概率與頻率01參數(shù):反映總體的統(tǒng)計指標(biāo)02統(tǒng)計量:反映樣本的統(tǒng)計指標(biāo)參數(shù)與統(tǒng)計量變量(variable)與資料(data)01觀察或測量的個體(或觀察單位)的某項特征,稱為變量。02如某地7歲兒童的身高、體重等。03變量值構(gòu)成資料。如,一組病人的血壓值計量資料:表現(xiàn)為具體的數(shù)值、有度量衡單位,如血壓、血糖等。百分率資料:減分率01計數(shù)資料:觀察指標(biāo)是定性的,如陰性、陽性,有病、無病等。二分類、多分類02等級資料:尿糖檢測結(jié)果的++++++、治療效果:痊愈、顯效、有效、無效等03不同的資料類型可以相互轉(zhuǎn)化04不同的資料類型有不同的統(tǒng)計分析方法05資料類型描述性統(tǒng)計(一)統(tǒng)計描述:描述樣本特征:列表、圖示、數(shù)字統(tǒng)計推斷:統(tǒng)計處理集中趨勢:平均水平算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)離散趨勢:變異性極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)計量資料分布特征和描述指標(biāo)總體均數(shù),樣本均數(shù)離均差平方和算術(shù)均數(shù):簡稱均數(shù),用以描述一組服從正態(tài)分布或近似正態(tài)分布資料的平均水平。離均差總和集中趨勢指標(biāo)-均數(shù)mean幾何均數(shù)G(geometricmean)用于對數(shù)正態(tài)分布的資料。即原變量值分布不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后,近似或服從正態(tài)分布的資料。血清學(xué)平均抗體效價位置指標(biāo)中位數(shù):一組資料按大小順序排列后,中間位置上的觀測值。23456723456----median=3.5中位數(shù)M(median)百分位數(shù)(percentile,Px)位置指標(biāo)一組資料從小到大排序后,x%的觀測值比Px小,(100-x)%的觀測值比Px大,則這個位置點(diǎn)的數(shù)值,即為第x百分位數(shù)Px。第5百分位數(shù)P5:有5%的觀測值比P5小,有95%的觀測值比P5大。中位數(shù)即第50百分位數(shù)。用于偏態(tài)分布的資料。極差或全距range:最大值與最小值之差。01只考慮最大值和最小值,沒有考慮所有的變量。02離散趨勢的指標(biāo)-極差R第25百分位數(shù)P25,第50百分位數(shù)P50,第75百分位數(shù)P75,將所有的數(shù)據(jù)分為四份。P75-P25即為四分位數(shù)間距??紤]了較多的變量信息,但信息利用仍不充分。四分位數(shù)間距Q方差:總體方差,樣本方差S201離均差平方和的平均值即為方差。02方差variance標(biāo)準(zhǔn)差SD/STD(standarddeviation)01方差開方即為標(biāo)準(zhǔn)差02求方差后,量綱為原量綱的平方。03為使量綱恢復(fù)到原量綱,將方差開方,即為標(biāo)準(zhǔn)差。04總體標(biāo)準(zhǔn)差,樣本標(biāo)準(zhǔn)差S用于比較不同量綱的變量的變異程度。01無量綱02變異系數(shù)CV上述指標(biāo)都是用于計量資料的統(tǒng)計描述1除變異系數(shù)外,均有量綱2變異性指標(biāo)中,指標(biāo)值越大,說明數(shù)據(jù)變異越大3分布類型不同,適用的描述指標(biāo)不同。4正態(tài)分布常用5偏態(tài)分布常用中位數(shù)M和最小值、最大值或四分位數(shù)間距。如:年齡中位數(shù)為33.5歲,最小年齡3歲,最大年齡55歲。6小結(jié)0102絕對數(shù):實(shí)際觀察所得相對數(shù):率、構(gòu)成比、相對比計數(shù)資料的統(tǒng)計描述例題:2005年某市五地區(qū)糖尿病患病情況地區(qū)編號調(diào)查人數(shù)患病人數(shù)患病率(%)構(gòu)成比(%)患病率相對比(%)(1)(2)(3)(4)(5)(6)A97776857.0121.52--B114106325.5419.8679.03C121816985.7321.9281.74D103915415.2117.0074.32E105116275.9719.7085.16合計5427031835.87100.00--01說明在一定條件下,某現(xiàn)象發(fā)生的頻率或強(qiáng)度。03使結(jié)果中保留1-2位小數(shù);02K:比例基數(shù),常用百分率(%)、千分率、萬分率、十萬分率等。04根據(jù)習(xí)慣用法率(rate)發(fā)病率、患病率、死亡率、病死率等;01發(fā)病率(incidencerate):一定期間內(nèi)、一定人群中,某病新病例出現(xiàn)的頻率。02描述疾病的發(fā)生頻率。03常用的率患病率(prevalencerate):現(xiàn)患率,某特定時間內(nèi)總?cè)丝谥?,現(xiàn)患有某病的人(包括新和舊病例)所占的比例。常用于表示病程較長的慢性病的發(fā)生或流行情況。與發(fā)病率和病程有關(guān)。321常用的率死亡率(mortalityrate):一定期間內(nèi),一定人群中,死于某?。ɑ蛩烙谒性颍┑念l率。是測量人群死亡危險最常用的指標(biāo)。常用的率病死率(fatalityrate):表示一定時期內(nèi)(通常為1年),患某病的全部病人中因該病死亡者的比例。01用于表示確診疾病的死亡概率,可表明疾病的嚴(yán)重程度,也可反映醫(yī)療水平和診斷能力。多用于急性傳染病,較少用于慢性病。02常用的率常用的率在臨床實(shí)際中,要注意區(qū)分上述四種常用率指標(biāo)的含義,不要混淆。說明某一事物的內(nèi)部各組成部分所占的比重或分布。1常用來表示疾病或死亡發(fā)生的分布情況,不能表示其發(fā)生頻率或嚴(yán)重程度。2構(gòu)成比(proportion)又稱相對比,表示兩個有關(guān)的指標(biāo)之比,可用倍數(shù)或百分?jǐn)?shù)表示。1甲乙兩個指標(biāo)可以是絕對數(shù)、相對數(shù)等;2性質(zhì)可以相同,也可以不同。3如果計算時,分子大于分母,結(jié)果用倍數(shù)表示;反之,結(jié)果用百分?jǐn)?shù)表示。4比(ratio)010203分母不宜過?。赫_區(qū)分率與構(gòu)成比的意義:正確計算總率:即合計率或平均率。應(yīng)將各組實(shí)際發(fā)生某現(xiàn)象的觀察單位數(shù)之和,除以各組可能發(fā)生該現(xiàn)象的觀察單位數(shù)之和,再乘以比例基數(shù)K。注意事項隨機(jī)化:隨機(jī)抽樣原則;觀察對象同質(zhì)、研究方法相同、觀察時間相等以及其他影響因素相同或接近;觀察對象的內(nèi)部構(gòu)成是否相同:即與比較指標(biāo)有關(guān)的影響因素在比較組間是否均衡。內(nèi)部構(gòu)成不同時,需分層分析或進(jìn)行標(biāo)化。0102比較相對數(shù)指標(biāo)時,注意資料的可比性:注意事項注意事項樣本率(或構(gòu)成比)的比較,要做假設(shè)檢驗:樣本率或構(gòu)成比存在抽樣誤差,相互比較時需要進(jìn)行假設(shè)檢驗。一種連續(xù)型隨機(jī)變量常見而重要的分布。高斯分布:最初由德國數(shù)學(xué)家和天文學(xué)家德.莫阿弗爾于1733年提出。但高斯將其迅速應(yīng)用到天文學(xué)中,并對其性質(zhì)進(jìn)行了進(jìn)一步的研究,因此又稱為高斯分布。正態(tài)分布是自然界中最常見、最重要的一種連續(xù)型分布,是許多統(tǒng)計分析方法的基礎(chǔ)。醫(yī)學(xué)中很多數(shù)據(jù)都近似服從正態(tài)分布。0102正態(tài)分布頻數(shù)分布當(dāng)樣本量無限增大以及橫軸上的組距無限減小時,直方圖外緣就變成一條光滑的曲線,這條概率密度曲線所描述的分布就近似于正態(tài)分布。1和可以完全決定一個正態(tài)分布的形狀,因此,對于一個正態(tài)分布,可記為32是正態(tài)分布的兩個參數(shù),其中為x的總體均數(shù),是x的總體方差。是兩個常數(shù),分別為圓周率(3.14159)和自然對數(shù)的底(近似于2.71828)正態(tài)分布單峰分布,以x=為中心,左右完全對稱,正態(tài)曲線以x軸為漸近線,兩端與x軸永不相交。01在x=處有最大值,即此時曲線最高。02有兩個參數(shù):位置參數(shù),決定正態(tài)曲線在x軸上的位置;形狀參數(shù),決定正態(tài)曲線的分布形狀。03正態(tài)分布的特征01在σ不變的情況下,函數(shù)曲線形狀不變,若μ變大時,曲線位置向右移;若μ變小時,曲線位置向左移。02在μ不變的情況下,函數(shù)曲線位置不變,若σ變大時,曲線形狀變的越來越“胖”和“矮”;若σ變小時,曲線形狀變的越來越“瘦”和“高”。正態(tài)分布的特征N(μ1,σ2)、N(μ2,σ2)N(μ,0.52)、N(μ,12)、N(μ,22)0102正態(tài)分布的特征正態(tài)分布的特征正態(tài)分布的特征曲線下的總面積為1或100%。所有正態(tài)曲線,在左右的任意個標(biāo)準(zhǔn)差范圍內(nèi)面積相同曲線下面積正態(tài)分布曲線下的面積01許多醫(yī)學(xué)現(xiàn)象服從正態(tài)分布或近似正態(tài)分布,可制定醫(yī)學(xué)參考值范圍;02偏態(tài)分布的資料可轉(zhuǎn)換為正態(tài)分布或近似正態(tài)分布,然后按照正態(tài)分布的規(guī)律進(jìn)行處理;03正態(tài)分布是許多統(tǒng)計分析方法的理論基礎(chǔ);正態(tài)分布的應(yīng)用對于任意一個正態(tài)分布,均可轉(zhuǎn)換為均數(shù)為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)化變換:u變換或Z變換u或Z叫標(biāo)準(zhǔn)化離差,實(shí)際就是用標(biāo)準(zhǔn)差作單位來度量離均差的大小。標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布縱坐標(biāo)從-∞移到u所對應(yīng)區(qū)域的面積為上圖紅色區(qū)域面積的大小,這樣一個區(qū)域的面積我們用Ф(u)表示,可通過查標(biāo)準(zhǔn)正態(tài)分布曲線面積分布表得到Ф(u)的大小。u值查表所對應(yīng)的面積是區(qū)間(-∞,u)所對應(yīng)的面積,即Ф(u)。若u=-1.96,那么Ф(-1.96)則表示從-∞移到-1.96所對應(yīng)區(qū)域的面積,通過查標(biāo)準(zhǔn)正態(tài)分布曲線面積分布表得到Ф(-1.96)=0.025321標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布曲線下的面積計算方法:正態(tài)分布法、百分位數(shù)法02正常值范圍:按一定概率所確定的數(shù)據(jù)波動范圍。01醫(yī)學(xué)參考值范圍的確定選擇足夠數(shù)量的正常人作為參照樣本對選定的參照樣本進(jìn)行準(zhǔn)確地測定單雙側(cè)范圍的確定選擇適當(dāng)?shù)陌俜址秶?1.02.03.04.醫(yī)學(xué)參考值范圍的確定正態(tài)分布法正態(tài)性檢驗計算均數(shù)、標(biāo)準(zhǔn)差計算參考值范圍雙側(cè):單側(cè):或90%、95%、99%參考值范圍95%參考值范圍:單雙側(cè)的確定,要依據(jù)專業(yè)知識研究對象:“正常人”同質(zhì)足夠例數(shù)---有代表性控制誤差:系統(tǒng)誤差隨機(jī)誤差單雙側(cè)界值:專業(yè)知識適當(dāng)?shù)陌俜纸缰担杭訇栃裕ㄕ`診)、假陰性(漏診)制定醫(yī)學(xué)參考值范圍的注意事項95%的參考值范圍:95%的變量值的波動范圍;95%的變量值在這個范圍內(nèi)不可理解為:在參考值范圍內(nèi)的均為健康人,在參考值范圍外的均不健康。0102醫(yī)學(xué)參考值范圍的含義統(tǒng)計推斷總體:根據(jù)研究目的確定的同質(zhì)個體構(gòu)成總體。樣本:從總體中隨機(jī)抽取的部分個體,構(gòu)成樣本。抽樣研究:從總體中隨機(jī)抽取部分觀察對象進(jìn)行研究,通過樣本信息來推斷總體特征的研究方法。基本概念抽樣誤差由于抽樣所導(dǎo)致的誤差。某地區(qū)7歲男童的身高110cm樣本1100例105cm樣本2100例100cm樣本3100例120cm由于隨機(jī)抽樣而引起的來自同一總體的樣本均數(shù)之間以及樣本均數(shù)與相應(yīng)的總體均數(shù)之間的差異,稱之為均數(shù)的抽樣誤差。01標(biāo)準(zhǔn)差:反映個體差異,反映變量值的變異程度。02標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差,用以反映抽樣誤差的大小。03與總體標(biāo)準(zhǔn)差成正比,與樣本含量的平方根成反比。04一定時,n越大,標(biāo)準(zhǔn)誤就越小,n越小,標(biāo)準(zhǔn)誤就越大。05影響抽樣誤差的主要因素是樣本含量。標(biāo)準(zhǔn)誤作為總體參數(shù),通常是未知的,在實(shí)際工作中常用樣本標(biāo)準(zhǔn)差S來估計。所以:01作為標(biāo)準(zhǔn)誤的估計值。02標(biāo)準(zhǔn)誤樣本均數(shù)的抽樣分布特點(diǎn):從正態(tài)總體中隨機(jī)抽取例數(shù)為n的樣本,其樣本均數(shù)的分布服從正態(tài)分布;從非正態(tài)總體中抽樣,當(dāng)n足夠大時,樣本均數(shù)的抽樣分布近似服從正態(tài)分布0102中心極限定理進(jìn)行假設(shè)檢驗所必需的重要統(tǒng)計量。03用于計算總體均數(shù)的可信區(qū)間。02反映樣本統(tǒng)計量變異程度的指標(biāo),常用來反映抽樣誤差的大小。01標(biāo)準(zhǔn)誤的應(yīng)用中心極限定理:樣本均數(shù)的分布服從正態(tài)分布。u轉(zhuǎn)換:正態(tài)分布通過標(biāo)準(zhǔn)化轉(zhuǎn)換可轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布。010203t分布01在實(shí)際工作中,是未知的,用來代替。因此,標(biāo)準(zhǔn)誤估計值代替了理論標(biāo)準(zhǔn)誤,因此,此時轉(zhuǎn)化后的分布不再符合標(biāo)準(zhǔn)正態(tài)分布,而服從t分布。自由度020304t分布與自由度有關(guān)。不同的自由度對應(yīng)不同的t分布曲線。t分布以0為中心,左右對稱的單峰分布。t分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)。自由度越小,t值越分散,曲線越低平;自由度逐漸增大時,則t分布逐漸逼近正態(tài)分布(標(biāo)準(zhǔn)正態(tài)分布)。當(dāng)時,t分布即為u分布。t分布曲線的峰值較低,而尾部曲線較高,說明遠(yuǎn)側(cè)t值的個數(shù)較多,自由度越小,這種情況越明顯。t分布的特征t分布曲線下面積的分布規(guī)律由于t分布曲線是一組曲線,故t分布曲線下面積為95%和99%界值不是一個常量,隨著自由度的變化,95%或99%面積的界值發(fā)生變化,當(dāng)時,95%和99%面積對應(yīng)的界值趨近于u值。t分布的特征參數(shù)估計:點(diǎn)估計、區(qū)間估計01點(diǎn)估計:樣本統(tǒng)計量直接作為總體參數(shù)估計值02區(qū)間估計:可信區(qū)間或置信區(qū)間CI。用已知的樣本統(tǒng)計量和標(biāo)準(zhǔn)誤確定一個有概率意義的區(qū)間,該區(qū)間有較大可信度包含總體參數(shù)。03可信度:1-。95%、99%04總體均數(shù)的估計12如果能進(jìn)行重復(fù)抽樣試驗,平均有1-的可信區(qū)間包含了總體參數(shù)。有1-的可能性包含了總體均數(shù)。12可信區(qū)間的含義假設(shè)檢驗的基本思想小概率反證法,即先建立一個關(guān)于樣本所屬總體的假設(shè),考察在假設(shè)成立條件下隨機(jī)樣本的特征信息是否屬小概率事件,若為小概率事件,則懷疑假設(shè)成立有悖于該樣本所提供特征信息,因此拒絕假設(shè)。A療效=B療效A藥65%B藥80%?假設(shè)檢驗A有效率=B有效率A藥65%B藥80%抽樣誤差A(yù)有效率A藥65%B藥80%不同總體B有效率假設(shè)檢驗抽樣誤差不同總體μ0=72.1次/分74.3次/分μ74.3次/分μ0=72.1次/分=在μ=μ0的前提下,計算從這個總體中進(jìn)行隨機(jī)抽樣,得到目前這樣結(jié)果的概率有多大,然后與事先確定的檢驗水準(zhǔn)0.05比較,得出結(jié)論。無效假設(shè)H0:μ=μ0,即山區(qū)成年男子與一般成年男子的脈搏總體均數(shù)相同,或來自同一總體。建立檢驗假設(shè)和確定檢驗水準(zhǔn):雙側(cè)H1:μ≠μ0備擇假設(shè)H1:有單雙側(cè)之分。單側(cè)H1:μ>μ0或μ<μ0單雙側(cè)根據(jù)專業(yè)知識和研究目的而定。假設(shè)檢驗的步驟1單側(cè)檢驗應(yīng)特別注明。同一資料,單側(cè)檢驗比雙側(cè)檢驗更易獲得拒絕H0的結(jié)論。雙側(cè)檢驗更為穩(wěn)妥和保守,多用雙側(cè)檢驗。如無特殊說明,一般均為雙側(cè)檢驗。假設(shè)檢驗的步驟1確定檢驗水準(zhǔn)α是預(yù)先人為確定的概率,一般為0.05。表示拒絕實(shí)際上成立的H0時,推斷錯誤的最大允許概率,即在拒絕H0做出“有差別”結(jié)論時可能犯錯誤的最大允許概率。就是一個標(biāo)準(zhǔn)。用于和P值比較,得出結(jié)論。P≤α?xí)r,拒絕H0,接受H13214假設(shè)檢驗的步驟1計算檢驗統(tǒng)計量1根據(jù)資料類型、試驗設(shè)計方法、研究目的和各種統(tǒng)計檢驗方法的應(yīng)用條件選擇恰當(dāng)?shù)臋z驗方法2如t檢驗、方差分析等3假設(shè)檢驗的步驟2根據(jù)計算出的檢驗統(tǒng)計量的抽樣分布確定P值,與α比較,決定是否拒絕H0。02確定P值,做出統(tǒng)計推斷結(jié)論。01假設(shè)檢驗的步驟3樣本含量較小時,理論上要求樣本為來自正態(tài)分布總體的隨機(jī)樣本當(dāng)兩小樣本均數(shù)比較時,要求兩總體方差相等(方差齊性)應(yīng)用條件:t檢驗單樣本t檢驗用于樣本均數(shù)與已知總體均數(shù)(一般為理論值,標(biāo)準(zhǔn)值或大量觀察得到的穩(wěn)定值)的比較。建立假設(shè)和確定檢驗水準(zhǔn):H0:μ=μ0=9.3cmH1:μ>μ0=9.3cmα=0.05(單側(cè)檢驗)計算檢驗統(tǒng)計量:12例例確定P值和做出推斷結(jié)論:查附表2的t界值表,得單側(cè)界值t0.05,11=1.796,因t=1.0257<t0.05,11,故P>0.05。按α=0.05水準(zhǔn),不拒絕H0,差別無統(tǒng)計學(xué)意義,還不能認(rèn)為該山區(qū)正常產(chǎn)男嬰雙頂徑大于一般男嬰雙頂徑。兩個同質(zhì)受試對象分別接受兩種不同處理同一受試對象分別接受兩種不同處理同一受試對象治療前后的比較(臨床研究中最常見)配對的目的是使除研究因素以外的其他因素保持均衡,更具有可比性。配對設(shè)計實(shí)質(zhì)等同于單樣本t檢驗。0102將每對數(shù)據(jù)轉(zhuǎn)化為單個差值,進(jìn)行差值的樣本均數(shù)與已知總體均數(shù)μ0=0的比較。配對t檢驗例建立假設(shè)和確定檢驗水準(zhǔn):H0:μd=0H1:μd>0α=0.05(單側(cè)檢驗)計算檢驗統(tǒng)計量:例確定P值和做出推斷結(jié)論:查附表2的t界值表,得單側(cè)界值t0.05,7=1.895,因t=2.264>t0.05,7,故P<0.05。按α=0.05水準(zhǔn),拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義,認(rèn)為實(shí)驗組大鼠血中膽堿酯酶活性高于對照組。01也叫成組設(shè)計的兩樣本均數(shù)比較的t檢驗。完全隨機(jī)設(shè)計也叫成組設(shè)計。旨在推論兩樣本均數(shù)所代表的兩總體均數(shù)是否不等。0203完全隨機(jī)設(shè)計兩樣本比較的t檢驗完全隨機(jī)設(shè)計或成組設(shè)計預(yù)選對象受試對象B組納入標(biāo)準(zhǔn)A組隨機(jī)化數(shù)據(jù)來源于兩個相互獨(dú)立的樣本

常見的完全隨機(jī)分組設(shè)計

A組B組某種自然屬性實(shí)質(zhì)等同于單樣本t檢驗。010102計算兩組數(shù)據(jù)的差值,將差值作為新的變量,進(jìn)行差值的樣本均數(shù)與已知總體均數(shù)(μ1-μ2)=0的比較。02總體方差相等的t檢驗例建立假設(shè)和確定檢驗水準(zhǔn):H0:μ1=μ2H1:μ1≠μ2α=0.05計算檢驗統(tǒng)計量:例確定P值和做出推斷結(jié)論:查附表2的t界值表,得單側(cè)界值t0.05/2,18=2.101,因|t|=4.22>t0.05/2,18,故P<0.05。按α=0.05水準(zhǔn),拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義,可認(rèn)為骨肌康治療組小鼠瓊脂肉芽腫平均重量低于乙醇對照組,即大劑量骨肌康搽劑對小鼠瓊脂肉芽腫生長有抑制作用。01兩組資料對應(yīng)的總體方差相等,即方差齊性。由于抽樣誤差的存在,因此,也需進(jìn)行假設(shè)檢驗。方差齊性檢驗(homogeneityofvariancetest)0203方差齊性檢驗總體方差不等的近似t檢驗在兩樣本t檢驗時,若兩總體方差不等,可考慮:變量變換秩和檢驗(基于秩的非參數(shù)檢驗)近似t檢驗(校正t檢驗或t’檢驗)Satterthwaite近似t檢驗:計算方法不變,只是對自由度進(jìn)行校正。見例題4-9兩樣本t檢驗:對應(yīng)的兩總體為正態(tài)總體,且方差齊單樣本t檢驗:隨機(jī)樣本來自正態(tài)總體配對t檢驗:差值的總體為正態(tài)總體正態(tài)性檢驗的必要性。在兩樣本t檢驗比較之前,要進(jìn)行正態(tài)性檢驗和方差齊性檢驗。0103020405正態(tài)性檢驗P值與α進(jìn)行比較,得出結(jié)論。01P≤α,拒絕H0,接受H1,按α檢驗水準(zhǔn),得“差別有統(tǒng)計學(xué)意義”的結(jié)論。反之,P>α,不拒絕H0(表示沒有充足的理由拒絕H0),按α檢驗水準(zhǔn),得“差別無統(tǒng)計學(xué)意義”的結(jié)論,但不能得“無差別”的結(jié)論,只能是“根據(jù)目前試驗結(jié)果,尚不能認(rèn)為有差別”。02不拒絕H0不等于接受H003推斷結(jié)論統(tǒng)計結(jié)論和專業(yè)結(jié)論專業(yè)結(jié)論:根據(jù)統(tǒng)計結(jié)論對實(shí)際問題中的總體特征是否不同以及差異的方向做出推斷并給出合理的解釋。0201推斷結(jié)論P(yáng)值:從H0所規(guī)定的總體中進(jìn)行隨機(jī)抽樣,所觀察到的比現(xiàn)有實(shí)驗結(jié)果更為“極端”的樣本檢驗統(tǒng)計量(小于等于或大于等于現(xiàn)有樣本統(tǒng)計量)出現(xiàn)的概率。01P值的大小不代表總體間差別的大小,不能認(rèn)為P值越小,總體參數(shù)間的差別就越大。02P值越小,說明H0成立的可能性越小,越有把握認(rèn)為H0不成立。03P值與α就是一個標(biāo)準(zhǔn)。用于和P值比較,得出結(jié)論。02α:是預(yù)先人為確定的概率,一般為0.05。表示拒絕實(shí)際上成立的H0時,推斷錯誤的最大允許概率,即在拒絕H0做出“有差別”結(jié)論時可能犯錯誤的最大允許概率。01P值與α無論是拒絕H0,還是不拒絕H0,都有可能犯錯誤。01I型錯誤(typeIerror):拒絕實(shí)際上成立的H0時,犯I型錯誤。大小為α?!皸壵妗盜型錯誤的含義:在H0成立的條件下,重復(fù)100次試驗,假設(shè)檢驗結(jié)果平均有5次拒絕H0。有單雙側(cè)。推斷正確的可能性則為1-α。又稱可信度。02030405假設(shè)檢驗的兩型錯誤-I型錯誤21II型錯誤(typeIIerror):不拒絕實(shí)際上不成立的H0時(“存?zhèn)巍保?,犯II型錯誤。大小為β。只取單側(cè),一般是未知的。只有在已知兩總體參數(shù)差值δ(如μ1-μ2)、α和n時,才能估算。II型錯誤01檢驗效能1-β:也叫把握度,其意義是:當(dāng)兩總體確有差別時,按現(xiàn)有的檢驗水準(zhǔn),假設(shè)檢驗?zāi)馨l(fā)現(xiàn)其差別的能力。02單側(cè)03如1-β=0.90,其含義是若兩總體確有差別,則理論上進(jìn)行100次抽樣,平均有90次能夠得出差異有統(tǒng)計學(xué)意義的結(jié)論。檢驗效能3241進(jìn)行樣本量估計時,要用到檢驗效能,一般,定檢驗效能為0.80,或0.90.當(dāng)出現(xiàn)陰性結(jié)果時,可能是確實(shí)沒有差別,也可能是樣本量小,檢驗效能太低,導(dǎo)致的假陰性。檢驗效能越大,樣本量就越大。樣本量小的時候,檢驗效能低,就容易得出假陰性的結(jié)論。即β較大。檢驗效能I型錯誤和II型錯誤真實(shí)情況假設(shè)檢驗結(jié)論拒絕H0不拒絕H0H0成立I型錯誤(α)推斷正確(1-α)H1成立推斷正確(1-β)II型錯誤(β

)α和β的關(guān)系:α越小,β就越大;α越大,β就越小。要同時減小α和β,唯一的方法就是增加樣本含量n。不可能同時犯I型錯誤和II型錯誤。拒絕H0時,只可能犯I型錯誤;不拒絕H0時,只可能犯II型錯誤。不管拒絕H0還是不拒絕H0,都會犯錯誤。α和β01不能絕對化,在表述上避免使用“肯定”、“一定”、“必定”等詞。統(tǒng)計結(jié)論和專業(yè)結(jié)論報告結(jié)論時,要列出檢驗統(tǒng)計量的值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論