整合分析中的非參數(shù)檢驗 重復(fù)取樣檢驗法的實例應(yīng)用_第1頁
整合分析中的非參數(shù)檢驗 重復(fù)取樣檢驗法的實例應(yīng)用_第2頁
整合分析中的非參數(shù)檢驗 重復(fù)取樣檢驗法的實例應(yīng)用_第3頁
整合分析中的非參數(shù)檢驗 重復(fù)取樣檢驗法的實例應(yīng)用_第4頁
整合分析中的非參數(shù)檢驗 重復(fù)取樣檢驗法的實例應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、生態(tài)環(huán)境2004,13(4):00616-618http:/www.eco-Ecology and EnvironmentE-mail: editoreco-基金項目:廣東省團隊項目(003031) ;國家自然科學(xué)基金資助項目(30270282)作者簡介:鄭鳳英(00001972) ,女,博士,副教授,主要從事植物生態(tài)學(xué)方面的研究和教學(xué)工作。 ,*通訊作者 Corresponding Author收稿日期:2004-07-078整合分析中的非參數(shù)檢驗: 重復(fù)取樣檢驗法的實例應(yīng)用鄭鳳英1,陸宏芳33,彭少麟2, 3*(1. 山東大學(xué)威海分校海洋生物工程系,山東 威海 ,264209;2. 中山大

2、學(xué)生命科學(xué)學(xué)院生態(tài)與進化研究所,廣東 廣州 ,510275;3. 中國科學(xué)院華南植物研究所園,廣東 廣州 ,510650)Non-parametric test for meta-analysis-Application of resampling testsZheng Fengying1Lu Hongfang3Peng Shaolin2,3(1. Shandong University in Weihai, Weihai, 264209; 2. Ecology and Evolution Institute, Life Science Department, ZhongshanUnivers

3、ity, Guangzhou, 510275;3.Zhongshan UniversitySouth China Institute of Botany,Academia Sinica, Guangzhou, 510650)Telmail:鄭鳳英等:整合分析中的非參數(shù)檢驗:重復(fù)取樣檢驗法的實例應(yīng)用617整合分析中的非參數(shù)檢驗 重復(fù)取樣檢驗法的實例應(yīng)用*摘要:整合分析((meta-analysis))是對同一主題下多個獨立實驗結(jié)果進行綜合的統(tǒng)計學(xué)方法。非參數(shù)檢驗整合分析重復(fù)取樣檢驗(resampling test)不考慮原文獻數(shù)據(jù)的分布形式,故可在不知原文獻數(shù)據(jù)分布形

4、式時使用。其中的靴襻法(bootstrap)可用來給出總效應(yīng)值的置信區(qū)間,但不能檢驗組內(nèi)異質(zhì)性是否顯著。靴襻法與隨機檢驗法((randomizationtest))可以有效彌補這一缺失,判斷出組間差異性是否顯著。實例應(yīng)用表明,重復(fù)取樣檢驗沒有參數(shù)檢驗保守,又與參數(shù)檢驗的結(jié)果差異較小。關(guān)鍵詞:整合分析, ;非參數(shù)檢驗, ;重復(fù)取樣檢驗, ;靴襻法, ;隨機檢驗法中圖分類號:Q141X131.3文獻標識碼:A文章編號:1672-2175(2004)04-0000616-03Non-parametrictestformeta-analysis-Application of resampling te

5、stsAbstract:Meta-analysis is a statistical method tosummarize independent studies under the same subject.Non-parametric test (resampling test) of meta-analysis do notconsider the distribution patterns of date, so that can be usedwhen primary data distribution patterns are unknown. Theconfidence inte

6、rval of overall effect size can be obtainedusingbootstrap,butitcannotconfirmthatiftheheterogeneity among class is confident. The integrationbetween bootstrap and randomization test can solve thisproblem. The sample application showed that resamplingtest is not more conservative than parametric test,

7、 and thedifference between their outcomes was small.Keyworks:meta-analysis,nonparametrictest,resampling test, bootstrap, randomization test.整合分析是對同一主題下多個獨立研究(來源于不同的文獻)進行綜合的一種統(tǒng)計推斷方法。它的基本思路是:第一步,先提出假設(shè);第二步,根據(jù)原文獻數(shù)據(jù)特點構(gòu)造一個統(tǒng)計量1,也稱效應(yīng)值,即將原文獻數(shù)據(jù)轉(zhuǎn)化為一個可在所有研究中進行比較的新統(tǒng)計量,并計算各研究的效應(yīng)值;第三步, 將所有研究的效應(yīng)值結(jié)合起來, 即根椐各效應(yīng)值的方差進行權(quán)

8、重,計算其加權(quán)平均效應(yīng)值(即總效應(yīng)值) ,并給出其置信區(qū)間, 根據(jù)總效應(yīng)值大小及其置信區(qū)間,可判斷總效應(yīng)值是否顯著。 顯著與否代表所研究因素對實驗對象有無影響,基金項目:廣東省團隊項目(003031) ; 國家自然科學(xué)基金項目(30270282)資助*通訊作者 CorrespondingAuthor效應(yīng)值正負代表影響的方向; 第四步, 計算所有研究間效應(yīng)值的異質(zhì)性,并進行顯著性檢驗; 第五步, 按不同研究特點將獨立研究分成不同的分組, 比較不同分組間的總效應(yīng)值及其總異質(zhì)性, 各分組及研究間的差異可用 x22分布來檢驗, 。我們曾介紹了遵循上述統(tǒng)計推斷思路的參數(shù)檢驗整合分析的計算方法2,并進行了

9、實例分析3,, 4。上述參數(shù)檢驗是在假設(shè)所有研究中的實驗組和對照組觀測值均遵循正態(tài)分布情況下進行的, 許多整合分析方法基于大樣本近似原理,即當(dāng)實驗組和對照組樣本含量不小于10 時,效應(yīng)值才趨于正態(tài)分布。但如果樣本太小,實驗組和對照組樣本含量太懸殊或效應(yīng)值太大時, 大樣本近似原理就變得不準確了5。但事實上,許多生態(tài)學(xué)觀察值違背了上述情況。此外,只有滿足上述假設(shè)時,用于檢驗研究間效應(yīng)值異質(zhì)性的 Q 值才有近似的 x22分布5。基于上述原因,Adams 將最初只用于單個研究分析中的重復(fù)取樣檢驗法 (一種非參數(shù)檢驗法)引入了整合分析中6, 。本文在國內(nèi)首次介紹整合分析中的重復(fù)取樣檢驗方法, 并以實例分

10、析的形式對參數(shù)檢驗和非參數(shù)檢驗整合分析法進行比較。1重復(fù)取樣檢驗法重復(fù)取樣檢驗法是取代傳統(tǒng)參數(shù)和非參數(shù)檢驗的一種好的非參數(shù)檢驗方法, 它龐大的計算必須依賴于計算機才能完成, 它的基本思路為多次打亂數(shù)據(jù)的排列方式, 每次都算出統(tǒng)計量值, 然后得出這個統(tǒng)計量的分布, 從而檢驗這個統(tǒng)計量的顯著性, 通過比較最初的統(tǒng)計量與后來產(chǎn)生的統(tǒng)計量分布形式可檢驗這個統(tǒng)計量的顯著水平。 重復(fù)取樣檢驗中的隨機檢驗(randomization test)常被用來決定一個統(tǒng)計量的顯著性水平,而靴襻法(bootstrap)則用于給出統(tǒng)計量的置618生態(tài)環(huán)境第 13 卷第 4 期(2004 年 11 月)信區(qū)間, 因為它們

11、產(chǎn)生自己的分布形式, 所以重復(fù)取樣檢驗不受參數(shù)檢驗分布假設(shè)的影響, 故在許多情況下, 比傳統(tǒng)的非參數(shù)檢驗排列法效率更高6, 7。用靴襻法來計算所有研究總效應(yīng)值和每一分組總效應(yīng)值的置信區(qū)間,對于研究數(shù)為 i 的每一分組或研究數(shù)為 i 的所有研究,我們先算出其總效應(yīng)值(即初值),然后以放回式取樣選取 i 個研究并計算其總效應(yīng)值(靴襻值),然后重復(fù)上述取樣方法多次, 按由小到大順序?qū)⒖傂?yīng)值排列起來,在兩端分別取 2.5%處值作為 95%置信區(qū)間上下限,置信區(qū)間包括零在內(nèi)的分組被認為沒有顯著不等于零。 用這種方法產(chǎn)生的置信區(qū)間叫百分靴襻法置信區(qū)間。 這種置信區(qū)間假設(shè)靴襻值以初值為中心, 如果此假設(shè)成

12、立, 則百分靴襻法就可產(chǎn)生正確的置信區(qū)間。當(dāng)樣本含量較小(即研究數(shù)少)時,往往會出現(xiàn)高于或低于初值的靴襻值數(shù)大于總靴襻值數(shù) 50%的現(xiàn)象, 此時可用偏差校正法 (bias-corrected method) 來校正,具體為:算出低于初值的靴襻值數(shù)占總靴襻值數(shù)的比例(F) ,用下式來較正即可。偏差校正后的百分置信區(qū)間的上下限取值范圍為:2-1(F)Z/2(1))(221ZF (1)(1)式中,為標準正態(tài)分布函數(shù),-1-1為的反函數(shù), Z/22Z為標準正態(tài)分布中的 ZZ 值,為顯著水平,一般取 0.050.05, 故 Z/22Z為 1.96, 如果 F0.5, 代入 (1)式得:2-1(0.5)Z

13、/2=(20Z/2)=(Z/2)=(1.96)=0.025025. 0)96. 1()()02()5 . 0(22212ZZZ025. 0)96. 1()()02()5 . 0(22212ZZZ和0.975, 此時沒有偏差, 百分置信區(qū)間的上下限分別為2.5%和 97.5%處值。用隨機檢驗來判斷分組間效應(yīng)值的差異(組間異質(zhì)性)是否顯著。 首先用原始數(shù)算出組間異質(zhì)性 Qb, 然后將 j 個分組里的所有研究混在一起,再隨機將它們分成 j 個分組,分組中研究數(shù)仍與原來相同, 算出 QbQb 值, 重復(fù)此過程多次,得出一個 QbQb 值的分布, QbQb 的顯著性水平為隨機 QbQb值大于等于實際 Q

14、bQb 值的數(shù)占重復(fù)隨機取樣數(shù)的百分比。隨機檢驗中的顯著水平部分地與重復(fù)次數(shù)成函數(shù), 重復(fù)次數(shù)增加,可降低最小可檢驗顯著水平值,例如,重復(fù) 49 次可檢驗出 0.02 的水平值,一般在 999 和 4999 重復(fù)次數(shù)之間就可保證合適的顯著水平。 但當(dāng)重復(fù)次數(shù)再增加時, 隨機檢驗中的標準誤差就會降低,以致于不能保證合適的顯著水平。表 1不分組與 3 種分組的總效應(yīng)值及其 3 種置信區(qū)間的比較(lnR)類別研究數(shù)總效應(yīng)值95%置信區(qū)間靴襻置信區(qū)間校正置信區(qū)間不分組690.219 50.219 50.104 70.217 50.070 60.217 80.070 4C3550.249 40.249

15、30.116 80.248 40.069 50.247 80.069 5C4120.025 50.025 50.293 50.046 80.236 30.045 00.235 0CAM20.393 80.393 83.649 40.393 80.031 90.393 80.031 9365 d50.288 60.288 60.627 10.279 10.191 80.267 80.180 5CE460.192 40.192 30.130 60.188 50.095 30.186 50.102 8OTC230.271 50.271 50.186 00.271 50.064 60.272 20.0

16、64 5*C3、C4、CAM 分別代表 C3植物,C4植物和 CAM 植物類型。265 d 分別代表用高 CO2處理小于 39 d,介于 5090d,102180 d,和大于 365 d 時測定植物生物量。CE, 、OTC 分別代表控制環(huán)境實驗(controlled environment)和開頂式同化箱實驗(open-top diamber)兩種實驗方法。表 2不分組與 3 種分組的總效應(yīng)值及其 3 種置信區(qū)間的比較(d)類別研究數(shù)總效應(yīng)值95%置信區(qū)間靴襻置信區(qū)間較正置信區(qū)間不分組690.810 00.810 00.243 80.819 30.222 30.829 00.227 7C355

17、0.894 80.894 80.252 20.914 20.220 30.914 60.220 1C4120.043 80.043 80.668 70.079 40.640 20.140 10.673 5CAM26.260 36.260 318.766 86.267 60.175 26.267 60.175 2365 d51.209 21.209 21.863 71.124 40.580 41.101 00.557 0CE460.678 90.678 90.293 10.684 60.294 60.682 30.295 3OTC231.114 11.114 10.461 61.136 50.3

18、14 11.146 50.318 4表中代號同表 1鄭鳳英等:整合分析中的非參數(shù)檢驗:重復(fù)取樣檢驗法的實例應(yīng)用6192非參數(shù)檢驗整合分析與參數(shù)檢驗整合分析的實例應(yīng)用比較我們以文獻4中的大氣 CO2濃度倍增對植物總生物量(Bt)的影響為例,進行參數(shù)檢驗和非參數(shù)檢驗兩種方法的應(yīng)用比較。數(shù)據(jù)的搜集和選擇同文獻4,采用隨機效應(yīng)模型和兩種效應(yīng)值 lnR 和 d 進行計算, 參數(shù)檢驗整合分析的計算方法見文獻2,兩種效值的計算見文獻1 。首先對所有獨立研究不分組計算其總效應(yīng)值、95%置信區(qū)間、靴襻置信區(qū)間以及校正置信區(qū)間, 然后再將所有研究以三個不同的標準(不同的植物光合途徑、不同的 BtBt 測定時間和不

19、同的高 CO2處理方法)進行分類再計算上述四項和組間異質(zhì)性檢驗的 P 值,計算時取 999 次重復(fù)(軟件推薦) 。分析結(jié)果見表 13。上述所有計算在 Metawin2.0 軟件上進行8。表 1 不分組與 3 種分組的總效應(yīng)值及其 3 種置信區(qū)間的比較(lnR)Table 1 overall effect sizes and confidence limits based on parametricmeta-analytic and resampling method(lnR)C3、 C4、 CAM 分 別 代 表 C3植 物 , C4植 物 和 CAM 植 物 類型;265d 分別代表用高 C

20、O2處理小于 39d, 介于50-90d,102-180d,和大于 365d 時測定植物生物量; CE, OTC 分別代表控制環(huán)境實驗(controlled environment)和開頂式同化箱實驗(open-topdiamber)兩種實驗方法。表 2 不分組與 3 種分組的總效應(yīng)值及其 3 種置信區(qū)間的比較(d)Table 2 overall effect sizes and confidence limits based onparametric meta-analytic and resampling method(d)表中代號同表 1從表 1 和表 2 看出,不論采用 lnR 還是

21、d 為效應(yīng)值,當(dāng)研究數(shù)變小時,95%置信區(qū)間都在加寬, ;以 lnR 為效應(yīng)值時,靴襻置信區(qū)間較 95%置信區(qū)間都在變窄, ;而以 d 為效應(yīng)值時,也只有 CE 和 102-108 d 兩個類別里,靴襻置信區(qū)間較 95%置信區(qū)間稍寬, ;而其它類別里都在大輻度變窄。 ,這與 Adam 的結(jié)果并不一致。 ,他的結(jié)果顯示靴襻置信區(qū)間較 95%置信區(qū)間寬, 即靴襻法較參數(shù)檢驗法要保守, 但在我們的實例分析中卻出現(xiàn)了后者比前者保守的情況, 但是。對于兩個效應(yīng)值, 我們可以看到其 95%置信區(qū)間和靴襻置信區(qū)間的差異并不是很大(除 N2 時) ,置信區(qū)間的中心值差異也很小。 ,校正置信區(qū)間與靴襻置信區(qū)間的

22、差異也很小,兩者區(qū)間寬度幾乎相等,但當(dāng) N2 時二者完全相等, 。這是因為 N2 時,盡管重復(fù)取樣 999 次,但在所計算的總效值里只有 3 個靴襻值的重復(fù),所以得到這樣的結(jié)果。表 3傳統(tǒng)參數(shù)檢驗與非參數(shù)檢驗(隨機檢驗)的組間異質(zhì)性顯著水平的比較Table 3 The comparison of confidence level of between-classhomogeneity between parametric test and randomization test對于兩個效應(yīng)值, 所有類別的三個區(qū)間均包括零,說明大氣 CO2升高與植物的生物量是呈正相關(guān)的,即會顯著提高植物的生物量。

23、從表 3 可看出,在對組間異質(zhì)性的檢驗中,x22檢驗的 P 值和隨機檢驗所得出的 P 值雖然大小略有差異,但在總體上并不改變檢驗的結(jié)果,以 lnR 為效應(yīng)值時,三種分類方法中組間異質(zhì)性均不顯著,而以 d 為效應(yīng)值時只有 C3、C4、CAM 三種不同光合類型植物間的差異較顯著。也只有在這一組里,隨機檢驗的 P 值大于 x22檢驗的 P 值,在其它組里均小于后者。3討論傳統(tǒng)參數(shù)整合分析往往忽略了原文獻數(shù)據(jù)的分布假設(shè)是否正確這一點, 如果分布假設(shè)不正確, 估計出的效應(yīng)值和置信區(qū)間就不準確, Adams 在比較了參數(shù)整合分析和重復(fù)取樣檢驗整合分析的結(jié)果后發(fā)現(xiàn)6,對于某些生物學(xué)數(shù)據(jù),后者給出的結(jié)果更為保

24、守一些, 所以他建議在進行整合分析時, 應(yīng)該考慮數(shù)據(jù)的分布假設(shè)是否正確。 雖然我們的實例分析結(jié)果表明重復(fù)取樣檢驗的結(jié)果并不比參數(shù)檢驗保守, 且我們的分析結(jié)果表明重復(fù)取樣給出的置信區(qū)間與參數(shù)檢驗差異并不大, 但還是有一定的差異, 在我們所綜合的原文獻里,樣本含量大于 10 的也有很限,只占 10%,因為重復(fù)檢驗并不考慮原文獻數(shù)據(jù)的分布形式, 所以我們還是建議在設(shè)法判斷原文獻數(shù)據(jù)分布時, 采用后者更為好一些。 因為整合分析是對過去已發(fā)表或未發(fā)表的文獻數(shù)據(jù)進行綜合, 文中的報道畢竟不能為分析者提供完全的數(shù)據(jù)統(tǒng)計信息, 所以有時分析者并不能憑借文中提供的信息來推斷數(shù)據(jù)的分布是否符合參數(shù)整合分析中的分布

25、假設(shè), 尤其是在生態(tài)學(xué)實驗中,往往樣本含量小于 10,所以在這里,更應(yīng)該考慮用重復(fù)取樣法。重復(fù)取樣檢驗法的另一個優(yōu)點便是它不用計算每一個研究效應(yīng)值的標準差用來權(quán)重, 所以如果一個整合分析選定象像 lnR 這樣計算中不需要標準差的效應(yīng)值, 就可以用非權(quán)重非參數(shù)整合分析 (取效應(yīng)值的非權(quán)重平均值) 來進行分析,同樣可得出置信區(qū)間, 并進行組間異質(zhì)性檢驗。 這時在權(quán)重參數(shù)整合分析時必須去掉的那些不報道標準差的文獻在重復(fù)取樣檢驗中就可以被利用了。 所以對于一些效應(yīng)值,重復(fù)取樣檢驗可以增加綜合文獻量, 增加整合分析中所結(jié)合的信息量。 但是重復(fù)取樣檢驗的一個顯著性弱點便是不能計算不表 3傳統(tǒng)參數(shù)檢驗與非參

26、數(shù)檢驗(隨機檢驗)的組間異質(zhì)性顯著水平的比較效應(yīng)值分組方式組間異質(zhì)性X2檢驗 P 值隨機檢驗 P 值d植物類型20.427 80.000 040.001lnR植物類型2.746 50.253 280.138d處理時間1.172 40.759 630.727lnR處理時間0.377 40.944 880.888d實驗方法2.690 60.100 940.085lnR實驗方法0.510 80.474 790.365620生態(tài)環(huán)境第 13 卷第 4 期(2004 年 11 月)分組或每一個分組內(nèi)的異質(zhì)性, 讓分析者無從知曉組內(nèi)效應(yīng)值差異,而這一點有時也是恰恰是分析者非常關(guān)心的。參考文獻:11 Zhe

27、ng F Y(鄭鳳英),Peng S L ((彭少麟) ). Meta 分析中幾種常用 效 應(yīng) 值 的 介 紹 Introduction, commonly used effect size inmeta-analysisJ.Ecol Sci(生態(tài)科學(xué)), 2001, 20((1)): 7-10. (inChinese).22 Peng S L((彭少麟)),Tang X Y(唐小焱). Meta 分析及其在生態(tài)學(xué)上的應(yīng)用-analysis and its application in ecologyJ. Chin J Ecol(生態(tài)科學(xué)學(xué)雜志),, 1998,, 17((5)):: 74-7

28、9. (in Chinese).33 Zheng F Y(鄭鳳英),Peng S L ((彭少麟) ). The meta-analysis onrelationship of predator and prey 捕食關(guān)系的 Meta 分析J. Acta EcolSin( 生態(tài)學(xué)報), 1999, 19(4): 448-452. ( in Chinese)44 Zheng F Y(鄭鳳英), Peng S L( 彭少麟). Meta-analysis of theresponse of plant ecophysiological variables to doubled atmospheri

29、cCO2concentrations 植物生理生態(tài)指標對大氣 CO2濃度倍增響應(yīng)的整合分析J.Acta Bot Sin(植物學(xué)報),, 2001,, 43((11) :):1101-1109.(in Chinese).55HEDGES,V,OLKINSI.StatisticalMethodsforMeta-AnalysisM. New York: Academic Press,. 1985, .: 55-59.66ADAMS D. Resampling test for meta-analysis of ecological dataJ.Ecology, 1997, 78(5): 1277-1

30、283.77 Manly B F. Randomizaion, bootstrap Bootstrap and Monte CarloMethods in Biology, (2ed)M. The second edition. New York:Chapman and Hall, New York,1997,.: 87-89.88 ROSENBERG M S, ADAMS D C, GUREVITCH J. MetaWin:Statistical Software For Meta-AnalysisM. Version 2.0. Sunderland:Sinauer, 2000.Non-pa

31、rametric test for meta-analysis: application of resampling tests_Application of resampling testsZHENG Feng-ying1, LU Hong-fang3, PENG Shao-lin2, 3*1. Weihai School of Shandong University in Weihai, Weihai, Shandong, 264209, China;2. Ecology and Evolution Institute, School of Life Science Department,

32、 Zhongshan University, Guangzhou, 510275, China;3. Zhongshan UniversitySouth China Institute of Botanic Gardeny,Academia SinicaChinese Academy of Sciences, Guangzhou, 510650, ChinaAbstract: Meta-analysis is a statistical method to summarize independent studies under the same subject. Non-parametric

33、test(resampling test)of meta-analysis do not consider the distribution patterns of date, so that can be used when primary datadistribution patterns are unknown. The confidence interval of overall effect size can be obtained using bootstrap, but it can notconfirm that if the heterogeneity among class

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論