直線相關教學課件_第1頁
直線相關教學課件_第2頁
直線相關教學課件_第3頁
直線相關教學課件_第4頁
直線相關教學課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

相關與偏相關2021/7/91醫(yī)學上,許多現象之間也都有相互聯系,例如:身高與體重、體溫與脈搏、產前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關系的現象中,它們之間聯系的程度和性質也各不相同。這里,體溫和脈搏的關系就比產前檢查與嬰兒體重之間的關系密切得多,而體重和身高的關系則介與二者之間。另外,可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關系;但是,有的現象之間因果不清,只是伴隨關系,例如丈夫的身高和妻子的身高之間,就不能說有因果關系。相關就是用于研究和解釋兩個變量之間相互關系的。

2021/7/92主要內容第一節(jié)直線相關第二節(jié)偏相關第三節(jié)小結2021/7/93第一節(jié)直線相關LinearCorrelation2021/7/94為了研究父親與成年兒子身高之間的關系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數字表示在坐標上,如圖。用水平軸X上的數代表父親身高,垂直軸Y上的數代表兒子的身高,1078個點所形成的圖形是一個散點圖。它的形狀象一塊橄欖狀的云,中間的點密集,邊沿的點稀少,其主要部分是一個橢圓。

2021/7/95一、相關的類型★正相關★負相關★完全正相關★完全負相關★稱零相關

2021/7/96二、相關系數

樣本的相關系數用r(correlationcoefficient)相關系數r的值在-1和1之間,但可以是此范圍內的任何值。正相關時,r值在0和1之間,散點云圖是斜向上的,這時一個變量增加,另一個變量也增加;負相關時,r值在-1和0之間,散點云圖是斜向下的,此時一個變量增加,另一個變量將減少。r的絕對值越接近1,兩變量的關聯程度越強,r的絕對值越接近0,兩變量的關聯程度越弱。2021/7/97三、相關系數的計算公式r的計算結果說明了兩個變量X與Y之間關聯的密切程度(絕對值大?。┡c關聯的性質(正負號)。2021/7/98一個產科醫(yī)師發(fā)現孕婦尿中雌三醇含量與產兒的體重有關。于是設想,通過測量待產婦尿中雌三醇含量,可以預測產兒體重,以便對低出生體重進行預防。因此收集了31例待產婦24小時的尿,測量其中的雌三醇含量,同時記錄產兒的體重。問尿中雌三醇含量與產兒體重之間相關系數是多少?是正相關還是負相關?分析問題:目的、變量、關系

2021/7/99編號

(1)尿雌三醇mg/24h(2產兒體重kg(3)編號

(1)尿雌三醇mg/24h(2)產兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

待產婦尿雌三醇含量與產兒體重關系

2021/7/9109、人的價值,在招收誘惑的一瞬間被決定。2023/2/32023/2/3Friday,February3,202310、低頭要有勇氣,抬頭要有低氣。2023/2/32023/2/32023/2/32/3/20235:02:14PM11、人總是珍惜為得到。2023/2/32023/2/32023/2/3Feb-2303-Feb-2312、人亂于心,不寬余請。2023/2/32023/2/32023/2/3Friday,February3,202313、生氣是拿別人做錯的事來懲罰自己。2023/2/32023/2/32023/2/32023/2/32/3/202314、抱最大的希望,作最大的努力。03二月20232023/2/32023/2/32023/2/315、一個人炫耀什么,說明他內心缺少什么。。二月232023/2/32023/2/32023/2/32/3/202316、業(yè)余生活要有意義,不要越軌。2023/2/32023/2/303February202317、一個人即使已登上頂峰,也仍要自強不息。2023/2/32023/2/32023/2/32023/2/32021/7/911計算結果從計算結果可以知道,31例待產婦尿中雌三醇含量與產兒體重之間程正相關,相關系數是0.61。2021/7/912問題:我們能否得出結論說明待產婦尿中雌三醇含量與產兒體重之間程正相關,相關系數是0.61?為什么?2021/7/913四、相關系數的假設檢驗

上例中的相關系數r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關關系。但是,這31例只是總體中的一個樣本,由此得到的相關系數會存在抽樣誤差。因為,總體相關系數()為零時,由于抽樣誤差,從總體抽出的31例,其r可能不等于零。所以,要判斷該樣本的r是否有意義,需與總體相關系數=0進行比較,看兩者的差別有無統(tǒng)計學意義。這就要對r進行假設檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關關系。

2021/7/914對相關系數的假設檢驗,常用t檢驗,選用統(tǒng)計量t的計算公式如下:=n-2

2021/7/915H0:

=0

H1:

≠0

=0.05r=0.61,n=31,

代入公式

t==n-2=31-2=29

t=4.14查t值表,=2.756,查t值表,=2.756,上述計算t=4.14>2.756,由t所推斷的P值小于0.01,按=0.05水準拒絕,接受,認為臨產婦24小時內尿中雌三醇濃度與產兒體重之間有正相關關系。

2021/7/916五、直線相關的應用

前面我們已經講過,相關是研究兩個變量間的相互關系,而且這種相互關系是用相關系數反應的。在確實存在相關關系的前提下,如果r的絕對值越大,說明兩個變量之間的關聯程度越強,那么,已知一個變量對預測另一個變量越有幫助;如果r絕對值越小,則說明兩個變量之間的關系越弱,一個變量的信息對猜測另一個變量的值無多大幫助。一般說來,當樣本量較大(n>100),并對r進行假設檢驗,有統(tǒng)計學意義時,r的絕對值大于0.7,則表示兩個變量高度相關;r的絕對值大于0.4,小于等于0.7時,則表示兩個變量之間中度相關;r的絕對值大于0.2,小于等于0.4時,則兩個變量低度相關。

2021/7/917例題:某地29名13歲男童身高X1(cm)、體重X2(kg)和肺活量Y(ml),請用該資料計算身高與肺活量,體重與肺活量的相關關系。2021/7/918第二節(jié)偏相關2021/7/919一、概念當有多個變量存在時,為了研究任何兩個變量之間的關系,而使與這兩個變量有聯系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計算兩個變量的相關性。二、偏相關系數偏相關系數是用來衡量任何兩個變量之間的關系的大小。2021/7/920三、選擇不同的方法計算相關系數

Pearson:雙變量正態(tài)分布資料,連續(xù)變量

Kendall:資料不服從雙變量正態(tài)分布或

總體分布未知,等級資料。

Spearman:等級資料。2021/7/921應用相關注意事項

1.實際意義進行相關回歸分析要有實際意義,不可把毫無關系的兩個事物或現象用來作相關回歸分析。例如,有人說,孩子長,公園里的小樹也在長。求孩子和小樹之間的相關關系就毫無意義,用孩子的身高推測小樹的高度則更加慌謬。2.相關關系相關關系不一定是因果關系,也可能是伴隨關系,并不能證明事物間有內在聯系,例如,有人發(fā)現,對于在校兒童,鞋的大小與閱讀技能有很強的相關關系。然而,學會新詞并不能使腳變大,而是涉及到第三個因素??年齡。當兒童長大一些,他們的閱讀能力會提高而且由于長大也穿不下原來的鞋。

2021/7/9223.利用散點圖對于性質不明確的兩組數據,可先做散點圖,在圖上看它們有無關系、關系的密切程度、是正相關還是負相關,然后再進行相關分析。4.變量范圍相關分析和回歸方程僅適用于樣本的原始數據范圍之內,出了這個范圍,我們不能得出兩變量的相關關系和原來的回歸關系。2021/7/923第三節(jié)小結

一、基本概念二、分析計算2021/7/9241.為了了解某地20~29歲健康女性血紅蛋白的正常值范圍,現隨機調查了該地2000名20~29歲的健康女性,并對其血紅蛋白進行測量,請問本次調查的總體是

A.該地所有20~29的健康女性

B.該地所有20~29的健康女性的血紅蛋白測量值

C.抽取的這2000名20~29歲女性

D.抽取的這2000名20~29歲女性的血紅蛋白測量值選擇最佳答案2021/7/9252.各觀察值加同一數后:A.均數不變,標準差改變B.均數改變,標準差不變C.二者均不變D.均改變3.用均數和標準差可全面描述:A.正偏態(tài)資料B.負偏態(tài)資料C.正態(tài)分布和近似正態(tài)分布D.任何分布4.正態(tài)分布曲線下,從均數u到u+1.96的面積為;2021/7/9265.按α=0.10水準做t檢驗,P>0.10,不能認為兩總體均數不相等,此時若推斷有錯,其錯誤的概率為()。

A.大于0.10B.β,而β未知

C.小于0.10D.1-β,而β未知6.某地正常成年男子紅細胞的普查結果,均數為480萬/mm3,標準差為41.0萬/mm3,后者反映()

A.個體變異B.抽樣誤差

C.總體均數不同D.均數間變異2021/7/9277.兩個樣本均數比較,經t檢驗,差異有顯著性,p越小,說明()A.兩樣本均數差別越大B.兩總體差別越大C.越有理由認為兩總體均數不同D.越有理由認為兩樣本均數不同

2021/7/928是非判斷:1.標準誤是一種特殊的標準差,其表示抽樣誤差的大小。2.N一定時,測量值的離散程度越小,用樣本均數估計總體均數的抽樣誤差就越小。3.假設檢驗的目的是要判斷兩個樣本均數的差別有多大。2021/7/929思考:1.標準差和標準誤有何區(qū)別和聯系?2.可信區(qū)間和參考值范圍有何不同?3.一類錯誤和二類錯誤的區(qū)別4.方差分析的基本思想是什么?2021/7/930分析計算要求:注意應用條件,選擇合適的計算程序在計算機上計算出結果會看結果完整的書寫出來2021/7/9311.1976年美國8歲男孩的平均身高為146厘米,標準差為8厘米,估計在該研究中有%多少的男孩平均身高在138與154之間?又有多少在130到162之間?2021/7/9322.隨機將20只雌性中年大鼠均分為甲、乙兩組,甲組大鼠不接受任何處理(即空白對照),乙組中的每只大鼠接受3mg/kg的內毒素,分別測得兩組大鼠的肌酐(μmol/L)數據,請問肌酐水平與內毒素有無關系?甲組:55,33,51,24,34,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論