科研統(tǒng)計(jì)分析1_第1頁
科研統(tǒng)計(jì)分析1_第2頁
科研統(tǒng)計(jì)分析1_第3頁
科研統(tǒng)計(jì)分析1_第4頁
科研統(tǒng)計(jì)分析1_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

科研統(tǒng)計(jì)分析常用檢驗(yàn)方法單樣本t檢驗(yàn)配對(duì)樣本t檢驗(yàn)兩樣本t檢驗(yàn)方差分析X2檢驗(yàn)秩和檢驗(yàn)統(tǒng)計(jì)分析初級(jí)統(tǒng)計(jì):統(tǒng)計(jì)描述統(tǒng)計(jì)檢驗(yàn)直線相關(guān)與回歸高級(jí)統(tǒng)計(jì):多因素方差分析協(xié)方差分析多元線性回歸

logistic回歸生存分析判別分析聚類分析……內(nèi)容提要資料類型設(shè)計(jì)類型常用檢驗(yàn)方法及其SPSS操作資料類型特點(diǎn)變量類型實(shí)例定量資料(數(shù)值變量資料)每個(gè)個(gè)體都能觀察到一個(gè)觀察指標(biāo)的數(shù)值,有度量衡單位連續(xù)型或離散型,數(shù)值變量身高(cm),體重(kg),細(xì)胞數(shù)(個(gè)),人口數(shù)(人)分類資料每個(gè)個(gè)體的觀察結(jié)果是屬性或分類,不是數(shù)值,清點(diǎn)各屬性或分類中個(gè)體的個(gè)數(shù),才得出分類資料的數(shù)據(jù)離散型

無序分類資料(計(jì)數(shù)資料)每個(gè)個(gè)體觀察結(jié)果的屬性或分類間無大小順序之分。二分類時(shí)為對(duì)立的兩類屬性,多分類時(shí)為不相容的多類屬性,類與類之間界限清楚,不會(huì)錯(cuò)判。離散型名義變量性別(男,女)為二分類;血型(A、B、O、AB)為多分類有序分類資料(等級(jí)資料)多分類,按程度、擋次等級(jí)順序分別計(jì)數(shù),各等級(jí)之間有程度的差別,按大小順序排列。每個(gè)觀察單位無確切定量。離散型順序變量療效(痊愈,好轉(zhuǎn),有效,無效)資料類型設(shè)計(jì)類型與統(tǒng)計(jì)檢驗(yàn)關(guān)系密切的幾種科研設(shè)計(jì)類型:?jiǎn)螛颖九鋵?duì)樣本兩樣本多樣本統(tǒng)計(jì)描述計(jì)量資料集中趨勢(shì)離散趨勢(shì)分布形態(tài)計(jì)數(shù)資料相對(duì)數(shù)、率行列表(RXC表,行列表)計(jì)量資料統(tǒng)計(jì)描述某工廠100例25~35歲車間女工血清汞含量(pg/L)測(cè)定結(jié)果如下:202165199234200213155168189170188168184147219174130183178174228156171199185195230232191224210195165178172124150211177184149159149160142210142185146223176241164197174172189174173205221184177161192181175178172136222113161131170138248153165182234161169221147209207164147210182183206209201149174253252156頻數(shù)分布表(frequencydistributiontable):將各觀察值及其相應(yīng)的頻數(shù)排列成表。頻數(shù)分布圖(frequencygraph):將各觀察值及其相應(yīng)的頻數(shù)繪制成圖。頻數(shù)分布表和頻數(shù)分布圖常用于觀察值個(gè)數(shù)較多資料的統(tǒng)計(jì)描述,可以直觀提示資料的分布特征和分布類型。計(jì)量資料統(tǒng)計(jì)描述頻數(shù)分布的特征從頻數(shù)分布表和頻數(shù)分布圖都可以看到頻數(shù)分布的重要特征:集中趨勢(shì)離散趨勢(shì)分布形狀。計(jì)量資料統(tǒng)計(jì)描述計(jì)量資料統(tǒng)計(jì)描述

標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤同:都是描述變異程度的指標(biāo)。異:標(biāo)準(zhǔn)差說明個(gè)體值的變異標(biāo)準(zhǔn)誤說明樣本統(tǒng)計(jì)量的變異標(biāo)準(zhǔn)誤是衡量樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。計(jì)數(shù)資料統(tǒng)計(jì)描述某醫(yī)師欲比較A方案與B方案治療中風(fēng)病的療效,結(jié)果見如下表。組別有效無效合計(jì)有效率(%)A方案2563180.65B方案2933290.63合計(jì)5496385.71不同方案對(duì)缺血性腦血管疾病的治療效果絕對(duì)數(shù):即實(shí)際頻數(shù),反映事物在某時(shí)某地出現(xiàn)的實(shí)際水平,是統(tǒng)計(jì)分析的基礎(chǔ)。相對(duì)數(shù):是兩個(gè)有聯(lián)系的指標(biāo)之比。

常用相對(duì)數(shù):相對(duì)比構(gòu)成比率計(jì)數(shù)資料統(tǒng)計(jì)描述單樣本計(jì)量資料的檢驗(yàn)正態(tài)檢驗(yàn)檢驗(yàn)思路單樣本t檢驗(yàn)單樣本秩和檢驗(yàn)不符合符合單樣本計(jì)量資料的檢驗(yàn)已知血清汞正常值為109.3pg/L?,F(xiàn)測(cè)得某工廠100例25~35歲車間女工血清汞含量(pg/L)測(cè)定結(jié)果如下。請(qǐng)問該廠女工血清汞含量是否超標(biāo)?1、正態(tài)分布資料,σ未知,小樣本時(shí),可用t檢驗(yàn)。σ已知或雖然σ未知,但n≥50時(shí)(s≈σ較好),可用z檢驗(yàn)(或稱u檢驗(yàn))。單樣本計(jì)量資料的檢驗(yàn)配對(duì)樣本計(jì)量資料的檢驗(yàn)對(duì)差值進(jìn)行正態(tài)檢驗(yàn)檢驗(yàn)思路配對(duì)樣本t檢驗(yàn)配對(duì)樣本秩和檢驗(yàn)不符合符合

配對(duì)t檢驗(yàn)是將配對(duì)的兩組相關(guān)資料轉(zhuǎn)化為單組差值資料,進(jìn)行配對(duì)差值的樣本均數(shù)與總體均數(shù)μ0=0比較的t檢驗(yàn),適用于配對(duì)設(shè)計(jì)成功,對(duì)子差值服從正態(tài)分布的資料。配對(duì)樣本計(jì)量資料的檢驗(yàn)配對(duì)樣本計(jì)量資料的檢驗(yàn)

為比較兩種方法對(duì)乳酸飲料中脂肪含量測(cè)定結(jié)果是否相同,隨機(jī)抽取10份乳酸飲料制品,分別用哥特里-羅紫法和脂肪酸水解法測(cè)定脂肪含量,其結(jié)果如表1所示。問兩種方法測(cè)定的結(jié)果是否一致?編號(hào)12345678910哥特里-羅紫法0.820.6110.6840.6420.6770.9210.650.631.2580.777脂肪酸水解法0.580.5190.5230.310.3770.4170.4840.5220.9570.556表1兩種方法對(duì)乳酸飲料中脂肪含量的測(cè)定結(jié)果(%)兩樣本樣本計(jì)量資料的檢驗(yàn)正態(tài)檢驗(yàn)檢驗(yàn)思路兩樣本樣本t檢驗(yàn)配對(duì)樣本秩和檢驗(yàn)不符合符合,或經(jīng)數(shù)據(jù)轉(zhuǎn)換后符合兩樣本計(jì)量資料的檢驗(yàn)

某醫(yī)院將60例高脂血癥患者隨機(jī)分為試驗(yàn)組和對(duì)照組,分別給予試驗(yàn)藥物和對(duì)照藥物治療,表1是治療結(jié)束后的血清總膽固醇(mg/L)值,請(qǐng)分析試驗(yàn)藥物對(duì)血清膽固醇的療效。實(shí)驗(yàn)組202165199234200213155168189170174130183178174228156171199185210195165178172124150211177184對(duì)照組210142185146223176241164197174221184177161192181175178172136138248153165182234161169221147多組計(jì)量資料的檢驗(yàn)正態(tài)檢驗(yàn)檢驗(yàn)思路方差分析多組樣本秩和檢驗(yàn)不符合符合,或經(jīng)數(shù)據(jù)轉(zhuǎn)換后符合方差分析(analysisofvariance,縮寫為ANOVA)即變異數(shù)分析,是對(duì)變異的來源及大小進(jìn)行分析的一種統(tǒng)計(jì)方法。目的是分析分組的總體平均數(shù)是否相等。獨(dú)特之處在于不直接比較平均數(shù),而是利用變異的關(guān)系來進(jìn)行判別。方差分析的基本思想三種性質(zhì)不同的變異⑴總變異(totalvariation)⑵組內(nèi)變異(withingroupvariation)⑶組間變異(betweengroupsvariation)df總=N-1,df組內(nèi)=N-k,df組間=k-1離均差平方和除以其相應(yīng)的自由度即得方差,在方差分析中常稱為均方,記為MS。組內(nèi)均方(withingroupmeansquare)記為MS組內(nèi)組間均方(betweengroupsmeansquare)記為MS組間由于方差分析的思想獨(dú)特,分析問題精細(xì),不受對(duì)比的組數(shù)限制,可同時(shí)分析多個(gè)因素的作用,還可分析因素間的交互作用,所以,方差分析應(yīng)用非常廣泛,常用于多樣本均數(shù)比較;分析因素之間的交互作用;回歸方程的線性假設(shè)檢驗(yàn)等。方差分析有十幾種,不同方差分析方法用于不同設(shè)計(jì)類型的計(jì)量資料。方差分析的適用條件:要求資料滿足獨(dú)立性(independency)、正態(tài)性(normality)和方差齊性(homogeneityofvariance)。當(dāng)各組的樣本含量較大時(shí),樣本均數(shù)近似正態(tài)分布,所以,對(duì)于樣本含量較大的資料,方差分析都是強(qiáng)有力的分析方法。完全隨機(jī)設(shè)計(jì)資料的

方差分析、多重比較完全隨機(jī)設(shè)計(jì)兩個(gè)或多個(gè)樣本均數(shù)比較,滿足獨(dú)立性、正態(tài)性和方差齊性時(shí),可用單因素方差分析(one-wayANOVA)。多重比較多重比較(multiplecomparison)即多個(gè)樣本均數(shù)間的兩兩比較由于涉及的對(duì)比組數(shù)大于2,若仍用t檢驗(yàn)作每?jī)蓚€(gè)對(duì)比組比較的結(jié)論,會(huì)使犯第一類錯(cuò)誤的概率α增大,即可能把本來無差別的兩個(gè)總體均數(shù)判為有差別。有4個(gè)樣本均數(shù)間的兩兩比較有C42=4!/[2?。?-2)?。荩?次若每次比較的檢驗(yàn)水準(zhǔn)α=0.05,則每次比較不犯第一類錯(cuò)誤的概率為(1-0.05),按概率的乘法定理,6次比較均不犯第一類錯(cuò)誤的概率為(1-0.05)6,總的檢驗(yàn)犯第一類錯(cuò)誤的概率為1-(1-0.05)6=0.2649,比0.05大多了。在實(shí)驗(yàn)因素的個(gè)數(shù)大于等于2時(shí),如果采用t檢驗(yàn),還將無法研究實(shí)驗(yàn)因素之間的交互作用的大小。所以,多個(gè)樣本均數(shù)比較需另外采用兩兩比較的方法。多個(gè)樣本均數(shù)比較一般有兩種情況:一種是在研究設(shè)計(jì)階段未預(yù)先考慮或未預(yù)料到,經(jīng)數(shù)據(jù)結(jié)果的提示后,才決定的多個(gè)均數(shù)間的兩兩比較,常見于探索性研究,這種情況下,往往涉及到每?jī)蓚€(gè)均數(shù)的比較。另一種是在設(shè)計(jì)階段就根據(jù)研究目的或?qū)I(yè)知識(shí)而決定的某些均數(shù)間的兩兩比較,常見于事先有明確假設(shè)的證實(shí)性實(shí)驗(yàn)研究,例如多個(gè)處理組分別與一個(gè)對(duì)照組的比較,處理后不同時(shí)間分別與處理前的比較等。1、滿足正態(tài)性和方差齊性時(shí):多個(gè)實(shí)驗(yàn)組分別與一個(gè)對(duì)照組比較常用Dunnett法。每?jī)蓚€(gè)均數(shù)較常用最小顯著差異法(LSD)、SNK(Student-Newman-Keuls即q檢驗(yàn))法、Tukey(可靠顯著差異)法、Bonferroni(校正最小顯著差異)調(diào)整法等。2、不滿足方差齊性要求時(shí):Tamhane’sT2(基于t檢驗(yàn)的多重比較)、Dunnett’sT3(基于學(xué)生化最大模的多重比較)、Games-Howell(非參多重比較)、Dunnett’sC3(基于學(xué)生化極差的多重比較)多組計(jì)量資料的檢驗(yàn)

為探討不同給藥途徑與藥物體內(nèi)血藥濃度的關(guān)系,用微量放射性核素標(biāo)記藥物,通過放射性活度反映體內(nèi)藥物濃度(mmol/l),得到如下資料。試分析不同給藥途徑對(duì)體內(nèi)藥物濃度是否有影響?口服給藥0.210.260.180.340.470.680.340.540.270.310.340.60經(jīng)皮給藥1.341.011.051.041.271.140.931.291.461.531.071.56靜脈給藥5.365.025.084.785.454.885.194.984.885.255.335.42計(jì)數(shù)資料的假設(shè)檢驗(yàn)X2檢驗(yàn)的基本思想

X2檢驗(yàn)的基本思想

--------衡量實(shí)際頻數(shù)(actualfrequency)和理論頻數(shù)(theoreticalfrequency)之間的偏離度。理論數(shù)Trc的計(jì)算公式為:

Trc=

nr*nc/n

nr表示第r行的行合計(jì);nc表示第c列的列合計(jì);n表示總合計(jì)。H0:兩組療效相同H1:兩組療效不相同式中Arc表示R×C表中第r行(r=1,2,…,R)第c列(c=1,2,…,C)位置上的實(shí)際頻數(shù),簡(jiǎn)稱實(shí)際數(shù),簡(jiǎn)記為A;Trc表示與Arc相應(yīng)的理論頻數(shù),簡(jiǎn)稱理論數(shù),簡(jiǎn)記為T。Pearson2值反映了實(shí)際數(shù)和理論數(shù)吻合的程度。如果H0(兩組療效相同)成立,則實(shí)際數(shù)與理論數(shù)之差不會(huì)很大,2值應(yīng)較小,出現(xiàn)大2值的概率P是很小的,按小概率原理,一般應(yīng)不會(huì)發(fā)生。若根據(jù)試驗(yàn)結(jié)果算出H0成立的2值為小概率(P≤檢驗(yàn)水準(zhǔn)α),就懷疑H0成立,因而拒絕H0;若P>α,則沒有理由拒絕H0。X2檢驗(yàn)的基本思想

Pearson2的大小除決定于(A-T)2/T外,同時(shí)還取決于行列表的格子數(shù)的多少(嚴(yán)格地說是自由度的大?。?,因?yàn)楦鞲竦?A-T)2/T都是正值,故格子數(shù)愈多,2值也會(huì)很大。只有排除了這種影響,2值才能正確反映實(shí)際數(shù)A和理論數(shù)T的吻合程度。R×C表自由度(這里自由度是指必須獨(dú)立計(jì)算理論數(shù)的格子數(shù))的計(jì)算公式為:自由度df=(行數(shù)-1)(列數(shù)-1)=(R-1)(C-1)

四格表確切概率法

四格表資料:當(dāng)①總樣本含量n<40時(shí);或者②用其它假設(shè)檢驗(yàn)方法所得概率接近檢驗(yàn)水準(zhǔn)時(shí);或者③四格表中有實(shí)際頻數(shù)為0或有理論數(shù)T<1時(shí),都無法用2檢驗(yàn),常用以超幾何分布為前提的確切概率法(exacttest)作為2檢驗(yàn)應(yīng)用上的補(bǔ)充。四格表確切概率法的基本思想是:在四格表的周邊合計(jì)不變的條件下,分別計(jì)算出基本數(shù)據(jù)a、b、c、d各種組合之確切概率,按檢驗(yàn)假設(shè)取單側(cè)或雙側(cè)的累計(jì)概率,即可根據(jù)規(guī)定的檢驗(yàn)水準(zhǔn)作出推斷結(jié)論。計(jì)算Fisher確切概率的方法是:⑴選定一個(gè)統(tǒng)計(jì)量,例如|A-T|值或2值等,我們姑且將這個(gè)統(tǒng)計(jì)量記為D;計(jì)算樣本四格表的D,記為D0;⑵列出周邊合計(jì)不變條件下,a、b、c、d各種組合的四格表,對(duì)每一個(gè)四格表計(jì)算D;⑶按式8-9計(jì)算所有D值等于及大于樣本D0值的四格表的P值,符合D≥D0的那些四格表的P值之和,就是確切概率P值。四格表確切概率法

四格表資料:當(dāng)①總樣本含量n<40時(shí);或者②用其它假設(shè)檢驗(yàn)方法所得概率接近檢驗(yàn)水準(zhǔn)時(shí);或者③四格表中有實(shí)際頻數(shù)為0或有理論數(shù)T<1時(shí),都無法用2檢驗(yàn),常用以超幾何分布為前提的確切概率法(exacttest)作為2檢驗(yàn)應(yīng)用上的補(bǔ)充。注意(1)R×C表資料2檢驗(yàn)對(duì)理論數(shù)T的要求:R×C表中不宜有20%以上格子的T<5,不能有T<1。理論數(shù)太小時(shí)的處理辦法:①最好增加樣本例數(shù)以增大理論數(shù)。②刪去理論數(shù)太小的行和列。③將太小理論數(shù)所在行或列的實(shí)際數(shù)與性質(zhì)相近的鄰行鄰列合并,使重新計(jì)算的理論數(shù)增大。后兩法可能會(huì)損失信息,也可能會(huì)損害樣本的隨機(jī)性,不同的合并方式有可能影響推斷結(jié)論,故不宜作為常規(guī)方法。④不滿足2檢驗(yàn)條件的R×C表資料,最好計(jì)算R×C表的確切概率。R×C表的確切概率法計(jì)算概率的步驟同四格表確切概率法。因計(jì)算量較大,常用統(tǒng)計(jì)軟件完成。(2)由于R×C表的2檢驗(yàn)未考慮等級(jí)順序關(guān)系。當(dāng)處理效應(yīng)按強(qiáng)弱或優(yōu)劣分為若干個(gè)有序級(jí)別(如分為Ⅰ,Ⅱ,Ⅲ三個(gè)等級(jí))時(shí),不宜用2檢驗(yàn),宜用秩和檢驗(yàn)或Ridit分析(見第九章)比較各處理組的效應(yīng)有無差別。(3)多個(gè)樣本率(或構(gòu)成比)的2檢驗(yàn),結(jié)論為拒絕H0時(shí),只能認(rèn)為各總體率(或構(gòu)成比)之間總的來說有差別,不能說明它們彼此間都有差別,或某兩者間有差別。所以R×C表2檢驗(yàn)的一般做法是:若不拒絕H0,則不作進(jìn)一步分析;若拒絕H0,可進(jìn)一步作多個(gè)樣本率間的“兩兩比較”。2×k表k組間的兩兩比較若各組間兩兩比較,則檢驗(yàn)水準(zhǔn)需調(diào)整:

α′=α/比較次數(shù)=2α/[k(k-1)]假設(shè)檢驗(yàn)要注意的問題正確選擇檢驗(yàn)方法資料的可比性率的正確應(yīng)用假設(shè)檢驗(yàn)的結(jié)果是推斷性結(jié)論直線相關(guān)與回歸

對(duì)20名肥胖癥患者測(cè)定空腹血糖(mmol/L)、體重(kg),測(cè)定結(jié)果如下。試分析它們的相關(guān)性。

編號(hào)1234567891011121314151617181920空腹血糖5.05.74.96.05.15.45.55.45.4.85.75.46.75.74.97.06.76.67.27.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論