華北理工衛(wèi)生統(tǒng)計學(xué)實驗指導(dǎo)12相關(guān)與回歸_第1頁
華北理工衛(wèi)生統(tǒng)計學(xué)實驗指導(dǎo)12相關(guān)與回歸_第2頁
華北理工衛(wèi)生統(tǒng)計學(xué)實驗指導(dǎo)12相關(guān)與回歸_第3頁
華北理工衛(wèi)生統(tǒng)計學(xué)實驗指導(dǎo)12相關(guān)與回歸_第4頁
華北理工衛(wèi)生統(tǒng)計學(xué)實驗指導(dǎo)12相關(guān)與回歸_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

實驗十二:相關(guān)與回歸【目的要求】.掌握直線相關(guān)系數(shù)與回歸系數(shù)的意義、計算及應(yīng)用.掌握相關(guān)系數(shù)與回歸系數(shù)假設(shè)檢驗的方法.熟悉相關(guān)系數(shù)與回歸系數(shù)的區(qū)別與聯(lián)系.熟悉回歸方程的建立及應(yīng)用.了解相關(guān)與回歸分析應(yīng)用中的注意事項【案例分析】案例1:對某省不同地區(qū)水質(zhì)的碘含量及其甲狀腺腫的患病率作了調(diào)查后得到下表數(shù)據(jù),發(fā)現(xiàn)不同地區(qū)的甲狀腺腫的患病率的高低與本地區(qū)水質(zhì)的碘含量有關(guān)。于是利用Pearson積差相關(guān)系數(shù)的計算公式,把碘含量視為變量X,把甲狀腺腫的患病率視為因變量Y,計算出相關(guān)系數(shù),得廠-0.712,經(jīng)檢驗PC.002,據(jù)此認(rèn)為甲狀腺腫的患病率與水質(zhì)的碘含量之間有負(fù)相關(guān)關(guān)系,請討論:1、該資料是何種類型?2、題中分析方法是否正確?為什么?若不正確,應(yīng)當(dāng)搜集哪些資料?如何分析?某省不同地區(qū)水質(zhì)碘含量與甲狀腺腫患病率地區(qū)碘含量(ug/L)患病率(%)地區(qū)碘含量(ug/L)患病率(%)11.040.5107.76.322.037.7118.07.132.539.0128.09.043.520.0138.34.053.522.0148.54.064.037.4158.55.474.431.5168.84.784.515.61724.50.094.621.0案例2:現(xiàn)有一份170例某病患者的治療效果資料,按年齡和療效兩種屬性交叉分類,結(jié)果如表1。作者進(jìn)行了獨立性卡方檢驗,得到卡方值為23.582,自由度是4,拒絕兩種屬性分類相互獨立的零假設(shè);進(jìn)一步計算Pearson列聯(lián)系數(shù)為0.35,表明療效和年齡間存在一定關(guān)聯(lián)性。有人認(rèn)為這種方法不太好,他計算了患者年齡與療效的秩相關(guān)系數(shù),計算過程見表2。

表1170例某病患者的治療效果資料患者年齡前秩次P(歲)無效無效無效好轉(zhuǎn)治愈

pq無效好轉(zhuǎn)治愈pq<185322057(1+57)/2=2918?30381078(58+135)/2=96.550~15101035(136+170)/2=153合計50804017014535秩次q(1+50)/2(51+130)/2(131+170)/2=150.514535=25.5=90.5表2某病170例不同年齡患者與療效年齡X秩次PP2療效Y秩次qq2人數(shù)fpq<1825.5650.25無效298415739.5<1825.5650.25好轉(zhuǎn)96.59312.25302460.75<1825.5650.25治愈15323409153901.518?90.58190.25無效29841322624.518?90.58190.25好轉(zhuǎn)96.59312.25388733.2518?90.58190.25治愈153234091013846.550?150.522650.25無效29841204364.550?150.522650.25好轉(zhuǎn)96.59312.251014523.2550"150.522650.25治愈153234091023026.5加權(quán)合計145351593742.5——145351593742.51701153142.5pq少-殳…5一嘿=351000145352=1593607.5=350865492二pq少-殳…5一嘿=351000145352=1593607.5=350865492二£fpq-0堂府=1153142.5-14535x14535492=-89600=—0.2553lpq_-89600-V351000x350865=—0.2553經(jīng)假設(shè)檢驗,P=0.001,認(rèn)為患者療效與年齡之間存在負(fù)相關(guān)。請問,你對上述兩種分析方法有何評論?哪種方法更合理?為什么?案例3:為了探討鎘對機(jī)體免疫功能的影響,分別對每組20只lace小鼠以劑量為0.3、1.2、

2.4mg/kg/day的氯化鎘灌胃染毒14天,以20只未施染毒的小鼠為對照,分別測定小鼠脾淋巴細(xì)胞內(nèi)鈣調(diào)素含量(105ng/kg)如表所示。染毒劑量與鈣調(diào)素含量的分組信息染毒劑量(mg/kg/daY)染毒劑量(mg/kg/daY)樣本含量鈣調(diào)素含量(105ng/kg)5.38±2.864.68±2.724.32±2.263.70±2.67TOC\o"1-5"\h\z對照組5.38±2.864.68±2.724.32±2.263.70±2.671.2202.420對這份資料,研究人員作了如下的統(tǒng)計分析:四個劑量組間比較的方差分析、鈣調(diào)素均值與染毒劑量的相關(guān)系數(shù)、鈣調(diào)素均值關(guān)于染毒劑量的線性回歸。結(jié)論為:(1)經(jīng)方差分析得F=L417,p>0.05,認(rèn)為三個實驗組的鈣調(diào)素含量差異無統(tǒng)計學(xué)意義;(2)以各組的染毒劑量和鈣調(diào)素的組均值計算的相關(guān)系數(shù)(r=-0.9996,p<0.05),故又結(jié)論為:染毒劑量與鈣調(diào)素含量呈負(fù)相關(guān);(3)通過染毒劑量預(yù)測鈣調(diào)素含量效果很好。請討論:⑴對該研究數(shù)據(jù)進(jìn)行方差分析的目的是什么?(2)染毒劑量和鈣調(diào)素的相關(guān)分析應(yīng)該怎么做?(3)為了探討小鼠脾淋巴細(xì)胞內(nèi)鈣調(diào)素含量與氯化鎘染毒劑量的劑量一反應(yīng)關(guān)系,應(yīng)采用何種統(tǒng)計分析方法?(4)研究人員上述做法存在何種問題?【SPSS操作】L直線回歸分析AnalyzefRegressior)fLinear???fDependent:y-^Independent(s):xfOK2.線性相關(guān)分析Analyze->Correlate->Bivariate>Variables:x/yfCorrelationCoefficents:選擇合適的相關(guān)系數(shù)fOK【練習(xí)題】一、填空題.相關(guān)系數(shù)的意義是O.回歸系數(shù)的意義是o.分類資料宜用描述兩變量的相關(guān)性。.等級資料宜用描述兩變量的相關(guān)性。.多重線性回歸分析中,反映各自變量對反應(yīng)變量貢獻(xiàn)強(qiáng)弱的指標(biāo)是o.偏相關(guān)系數(shù)是o.復(fù)相關(guān)系數(shù)反映了o二、選擇題L相關(guān)系數(shù)的檢驗可用()A.散點圖直接觀察法代替B.t檢驗C.F檢驗D.卡方檢驗E.以上都可.計算積差相關(guān)系數(shù)要求()A.因變量Y是正態(tài)分布,自變量X可以不滿足正態(tài)要求

B.自變量X是正態(tài)分布,因變量Y可以不滿足正態(tài)要求C.兩變量都要求滿足正態(tài)分布規(guī)律D.兩變量只要是測量指標(biāo)就行E.因變量Y是定量指標(biāo),自變量X可以是任何類型數(shù)據(jù)TOC\o"1-5"\h\z.對R*C列聯(lián)表資料作頻數(shù)分布的比較與作兩變量關(guān)聯(lián)性分析()A.設(shè)計不同,卡方統(tǒng)計量一樣B.兩者僅假設(shè)不同C.兩者僅結(jié)論不同D.兩者的P值不同E.兩者檢驗水準(zhǔn)不同.對兩個分類變量的頻數(shù)表資料作關(guān)聯(lián)性分析()E.E.等級相關(guān)E.等級相關(guān)A.積差相關(guān)B.秩相關(guān)C.列聯(lián)系數(shù)D.線性相關(guān).如果求得的樣本相關(guān)系數(shù)r不等于0,則()E.等級相關(guān)A.兩變量間有相關(guān)關(guān)系C.|r|大時就有統(tǒng)計學(xué)意義E.A.兩變量間有相關(guān)關(guān)系C.|r|大時就有統(tǒng)計學(xué)意義E.對r作假設(shè)檢驗后才能推論.由樣本求得相關(guān)系數(shù)r=0.88,A.兩變量之間有高度相關(guān)性C.對應(yīng)的總體相關(guān)系數(shù)大于0.直線相關(guān)分析可用于研究(A.兒童的性別與體重C.兒童的性別與血型.相關(guān)系數(shù)的假設(shè)檢驗結(jié)果P<a,A.有直線相關(guān)關(guān)系C.有確定的直線函數(shù)關(guān)系B.兩變量間無相關(guān)關(guān)系D.n大時r就有統(tǒng)計學(xué)意義說明()B.r來自高度相關(guān)的總體D.對應(yīng)的總體相關(guān)系數(shù)不為0E.以上都不對)的數(shù)量關(guān)系B.兒童的身高與體重D.母親職業(yè)與兒童智商則在a水平上可認(rèn)為相應(yīng)的兩個變量間()B.有曲線相關(guān)關(guān)系D.有確定的曲線函數(shù)關(guān)系.相關(guān)系數(shù)r>0時,散點圖中散點的分布形態(tài)為()A.散點完全在一條直線上B.散點完全在一條直線上,且隨x增大,y也增大C.散點分布大致呈直線,且隨x增大,y值減小D.散點分布大致呈直線,且隨x增大,y值增大10.相關(guān)系數(shù)的取值范圍是(A.-1<r<1B.TWrWlA.-1<r<1B.TWrWlC.r取任意實數(shù)D.r取非負(fù)數(shù)A.認(rèn)為兩變量無直線相關(guān)C.證明兩變量一定不存在直線相關(guān)12.對同一總體連續(xù)抽取兩次樣本,n>ro.oi(vi),「2A.認(rèn)為兩變量無直線相關(guān)C.證明兩變量一定不存在直線相關(guān)12.對同一總體連續(xù)抽取兩次樣本,n>ro.oi(vi),「2〉「0.05?2),則可認(rèn)為(A.ri>r2B.C.不能據(jù)此確定二者大小關(guān)系B.認(rèn)為兩變量有直線相關(guān)D.尚不能確定兩變量有無相關(guān)關(guān)系分別計算相關(guān)系數(shù)n與r2,若直接查表法的檢驗結(jié)果為)ri<r2D.兩組資料的相關(guān)密切程度肯定不一樣.下列有關(guān)等級相關(guān)的敘述,錯誤的是()A.等級相關(guān)是一種非參數(shù)統(tǒng)計分析方法B.總體分布型未知的雙變量資料適宜作等級相關(guān)分析C.它是用相關(guān)系數(shù)r來說明兩變量相關(guān)密切程度與方向D.等級相關(guān)分析計算簡便,適用面廣.在相關(guān)性研究中,P值越小,則()A.兩變量相關(guān)性越好B.結(jié)論可信度越大C.抽樣誤差越小D.認(rèn)為總體具有線性相關(guān)的理由越充分E.抽樣誤差越大.在同一問題相關(guān)性研究中,樣本例數(shù)越大,則()A.兩變量相關(guān)性越好B.結(jié)論可信度越大C.認(rèn)為總體具有線性相關(guān)的理由越充分D.抽樣誤差越小E.抽樣誤差越大TOC\o"1-5"\h\z.對變量X和Y同時進(jìn)行簡單相關(guān)分析和簡單回歸分析,其結(jié)果一定是()A.r>0,b<0B.r<0,b>0C.rb>=0D.r=bE.r與b符號無關(guān).已知廠1,則一定有()A.SS總=5$剩B.SS剩=SS回C.SS剩=0D.b=lE.a=l.對含有常數(shù)項的線性回歸系數(shù)作假設(shè)檢驗,其自由度是()A.nB.n-lC.n_2D.2n-lE.2n~2.兩組資料,回歸系數(shù)b大的那一組()A.相關(guān)系數(shù)也大B.相關(guān)系數(shù)較小C.兩變量相關(guān)較密切D.例數(shù)較多E.兩組相關(guān)系數(shù)大小關(guān)系尚不能確定20?Y=14+4X是廣7歲以年齡(歲)估計體重(市斤)的回歸方程,若體重?fù)Q成國際單位公斤,則此方程()A.截距改變B.回歸系數(shù)改變C.兩者都改變D.兩者都不改變E.以上均可21.如果對簡單線性回歸模型進(jìn)行假設(shè)檢驗的結(jié)果是不能拒絕H0,這就意味著()A.該模型有應(yīng)用價值B.該模型無應(yīng)用價值C.該模型求解錯誤D.X與Y之間一定無關(guān)E.尚無充分證據(jù)說明X與Y之間有線性關(guān)系.求得Y關(guān)于X的線性回歸方程后,對回歸系數(shù)做假設(shè)檢驗的目的是對()做檢驗。A.樣本斜率B.總體斜率C.樣本均數(shù)D.總體均數(shù)E.樣本分布TOC\o"1-5"\h\z.在求出Y關(guān)于X變化的線性回歸方程后,發(fā)現(xiàn)將原始數(shù)據(jù)中的某一點(Xk,yk)的橫坐標(biāo)值代入方程后所得的值不等于yk,則可以認(rèn)為()A.此現(xiàn)象無法解釋B.此現(xiàn)象正常C.計算有錯誤D.X與Y之間呈非線性關(guān)系E.X與Y之間呈非線性關(guān)系.對含有兩個隨機(jī)變量的同一批資料,既作線性相關(guān),又作線性回歸分析工對相關(guān)系數(shù)檢驗的t值記為3,對回歸系數(shù)檢驗的t值記為二者之間的關(guān)系是()A.tr>tbB.tr<tbC.tr=tbD.tp^tbE.trWtb三、判斷題L樣本相關(guān)系數(shù)小于3則自變量與應(yīng)變量的離均差乘積和也必定小于0。()2,雙變量正態(tài)分布資料不能做等級相關(guān)分析。()3.等級相關(guān)系數(shù)的值必定介于0與1之間,值越大,表示相應(yīng)的兩個變量間關(guān)系越密切。()4,單向有序列聯(lián)表資料分析兩個變量間的關(guān)系可以做秩相關(guān)分析。()5,線性回歸模型的前提條件是:線性、獨立、正態(tài)與等方差。().回歸系數(shù)較大,表示兩變量的關(guān)系較密切。().樣本回歸系數(shù)小于0,而且假設(shè)檢驗結(jié)果有統(tǒng)計學(xué)意義,則可以認(rèn)為兩變量呈負(fù)相關(guān)。()8.由樣本數(shù)據(jù)計算獲得回歸方程,而且假設(shè)檢驗結(jié)果有統(tǒng)計學(xué)意義,則可以認(rèn)為變量X與Y間存在因果關(guān)系。().殘差圖可以簡單而又直觀地評價回歸分析的前提條件是否滿足().雙變量正態(tài)分布資料,樣本回歸系數(shù)小于零,可認(rèn)為兩變量呈負(fù)相關(guān)。().對于雙變量正態(tài)分布資料,同一樣本的相關(guān)系數(shù)及回歸系數(shù)與零的差別的統(tǒng)計檢驗結(jié)論一致。().樣本相關(guān)系數(shù)好0.8,就可認(rèn)為兩變量相關(guān)非常密切。().建立了回歸方程,且b有統(tǒng)計意義,就可認(rèn)為兩變量間存在因果關(guān)系。()四、思考題.直線回歸分析中應(yīng)注意哪些問題?.簡述直線回歸與直線相關(guān)的區(qū)別與聯(lián)系?.試總結(jié)從樣本數(shù)據(jù)判斷總體回歸關(guān)系是否成立的統(tǒng)計方法有哪些?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論