




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
九十一學年度第一學期
建築計量方法
統(tǒng)計三:變數(shù)間之關聯(lián)性杜功仁助理教授國立臺灣科技大學建築系2022/12/111九十一學年度第一學期
建築計量方法
統(tǒng)計三:變數(shù)間之主題三:變數(shù)間之關聯(lián)性檢定變數(shù)間之關聯(lián)性之分析方法XY皆為名目尺度:雙向表/卡方檢定Y為連續(xù)變數(shù),X為名目尺度:變異數(shù)分析XY皆為連續(xù)變數(shù):散佈圖,相關係數(shù),迴歸分析參考文獻統(tǒng)計,讓數(shù)字說話?。旱谖逭?/p>
2主題三:變數(shù)間之關聯(lián)性檢定變數(shù)間之關聯(lián)性之分析方法2研究流程提出研究問題大膽假設閱讀、研究、思考後,提出假設/理論,概念與變數(shù)小心求證─研究設計量測計劃抽樣計劃進行量測/資料收計資料整理分析一:描述統(tǒng)計分析二:驗證所提出之理論是否成立獲得答案3研究流程提出研究問題3研究─資料分析第一步:了解每一變數(shù)之分佈狀況名目:各類所佔百分比順序,區(qū)間/比例:極大極小值,平均值,離散程度了解每一變數(shù)之是否有錯誤,特殊案例第二步:了解每兩個變數(shù)間之關係雙向表/卡方檢定:XY皆為名目尺度變異數(shù)分析:Y為順序,區(qū)間/比例〔連續(xù)變數(shù)〕,X為名目尺度相關係數(shù):XY皆為順序,區(qū)間/比例尺度〔連續(xù)變數(shù)〕4研究─資料分析第一步:了解每一變數(shù)之分佈狀況4變數(shù)間之關聯(lián)性〔association〕兩變數(shù)是‘相關聯(lián)的’對於同樣個體度量之兩個變數(shù),若其中一變數(shù)之值隨著另一變數(shù)之改變而規(guī)律地改變,稱之。統(tǒng)計學之重點在於驗證‘平均而言’會成立的一些關聯(lián)性,而非證明一些定律。實例矮的女性,心臟病發(fā)作之風險較高身高與體重每天抽較多煙者通常較每天抽較少煙者的壽命短F=ma5變數(shù)間之關聯(lián)性〔association〕兩變數(shù)是‘相關聯(lián)的’變數(shù)間關聯(lián)性之分析方法6變數(shù)間關聯(lián)性之分析方法6雙向表two-waytable誰得到較多學位?性別與學位描述關聯(lián)7雙向表two-waytable7辛普森詭論說明當組數(shù)資料合併成一組資料時,相關性本質可能會改變,甚至轉換方向。小心潛在變數(shù)三向表入學審查有性別歧視?表,p.1978辛普森詭論說明8雙向表/三向表臺北市住宅所有權及住宅類型資料>樞紐分析表Excel清單或資料庫選取hs_use及hs_type欄〔managed?〕移動hs_use及hs_type按鈕至表中之‘列’及‘欄’位置〔移動managed?按鈕至表中之‘分頁’位置〕移動hs_type按鈕至表中之‘資料’位置按兩下‘資料’中之按鈕,指定摘要方式為‘項目個數(shù)’,指定資料顯示方式為‘總列或總欄的百分比’所得之數(shù)字表即為雙向表〔三向表〕9雙向表/三向表臺北市住宅所有權及住宅類型9卡方檢定獨立性檢定檢測二屬性間有無關係檢定資料之次數(shù)分配或比例分配是否有關係運算實際觀察次數(shù)估計期望次數(shù)Eij=i列總和xj行總和/樣本數(shù)獨立性檢定統(tǒng)計量=Chi-square值〔Excel〕Excel>f(x)函數(shù)>CHITEST>得Chi-square機率值決策法則若Chi-square機率值<=a-pha值0.05,則拒絕H0若Chi-square機率值>a-pha值0.05,則接受H0〔二者無關係〕10卡方檢定獨立性檢定10卡方檢定卡方檢定之限制每一個cell的期望次數(shù)應大於5,否則檢定無效若樣本數(shù)增大時,Chi-square值增大,容易拒絕H0。臺北市住宅類型及有無整建是否有關係?使用上述之雙向表Excel>插入>函數(shù)>統(tǒng)計>CHITESTChi-square機率值=0.0004<a-pha值0.05,拒絕H0N=282611卡方檢定卡方檢定之限制11變異數(shù)分析AnalysisofVarianceANOVA分析重點檢測多個樣本/母體之某一因子之平均數(shù)是否有顯著差異F檢定統(tǒng)計量:因子變異數(shù)〔組間〕/隨機變異數(shù)〔組內(nèi)〕假設H0:各母體之某平均數(shù)相等H1:各母體之某平均數(shù)不全相等決策法則F機率值>=0.05,接受H0F機率值<0.05,拒絕H0圖12.1,P.45012變異數(shù)分析AnalysisofVarianceANOVA變異數(shù)分析AnalysisofVariance例子四種教學設計對於教學成效是否有影響?男性和女性員工以及三種不同機器對於產(chǎn)量是否有影響?香水之三種包裝設計與三條行銷通路對於銷售量之影響?分析方式單因子變異數(shù)分析雙因子變異數(shù)分析雙因子變異數(shù)分析13變異數(shù)分析AnalysisofVariance例子13單因子變異數(shù)分析,完全隨機設計例子四種教學設計對於教學成效是否有影響?14單因子變異數(shù)分析,完全隨機設計例子14單因子變異數(shù)分析,完全隨機設計臺北市各類住宅之平均面積是否有差異?將資料轉換成各類住宅之面積資料表工具>資料分析>單因子變異數(shù)分析輸入資料範圍得ANOVA表15單因子變異數(shù)分析,完全隨機設計臺北市各類住宅之平均面積是否有散佈圖什麼是散佈圖?顯示在同一個體上度量之二變數(shù)間之關聯(lián)性二變數(shù)為順序、區(qū)間、或比例尺度其中一變數(shù)在X軸,另一變數(shù)在Y軸每一對觀察值為散佈圖中之‘一個點’16散佈圖什麼是散佈圖?16散佈圖美國各州SAT計分之詮釋17散佈圖美國各州SAT計分之詮釋17散佈圖之詮釋形式叢聚方向正相關:X變大時,Y亦變大負相關:X變大時,Y變小強度點之分佈越接近一直線時,關聯(lián)性越強偏離值突顯出偏離整體型態(tài)之一些個別觀察值〔主觀判對〕18散佈圖之詮釋形式18散佈圖臺北市住宅之住宅面積及總房間數(shù)插入>圖表>XY散佈圖選取住宅面積及總房間數(shù)二欄完成19散佈圖臺北市住宅之住宅面積及總房間數(shù)19相關係數(shù)什麼是相關係數(shù)?描述兩個變數(shù)之間線性〔only〕關聯(lián)之方向及強度用符號r表示-1<=r<=1使用統(tǒng)計軟體計算相關係數(shù)之意義r為正值=正相關,r為負值=負相關0<=|r|<0.3,弱度線性相關
0.3<=|r|<0.7,中度線性相關
0.7<=|r|<1.0,強度線性相關20相關係數(shù)什麼是相關係數(shù)?20相關係數(shù)21相關係數(shù)21相關係數(shù)臺北市住宅之住宅面積及總房間數(shù)工具>資料分析>相關係數(shù)選取住宅面積area
及總房間數(shù)total-rm二欄完成臺北市之住宅整建費用及住戶月收入reno_cost,total-family-income22相關係數(shù)臺北市住宅之住宅面積及總房間數(shù)22迴歸直線Regressionline迴歸直線是一條直線,描述因變數(shù)如何隨著自變數(shù)之改變而變用來預測:當X=某個值時,Y值會是多少?需先定義自變數(shù)及因變數(shù)〔不同於相關係數(shù)〕23迴歸直線Regressionline迴歸直線23最小平方迴歸LeastsquareregressionY對X之最小平方迴歸直線使得所有點距離直線之垂直Y方向距離平方和為最小之直線容易受到少數(shù)離群點outliers之嚴重影響迴歸方程式y(tǒng)=a+bxa:截距intercept,當x=0時之y值b:斜率,當x增加一個單位時,y值之改變量例子y=1425-19.9x〔x:溫度,y:瓦斯用量〕x=30,=>y=1425-19.9*30=82824最小平方迴歸Leastsquareregression最小平方迴歸Leastsquareregression迴歸裡的R2Y值之變異中,可以被Y對X之最小平方迴歸直線解釋之部分所佔百分比。XY之間的直線關係只能解釋部分Y之變異,而非全部。=Y預測值隨著x值沿直線移動時產(chǎn)生之變異/Y觀測值總變異0%<=R2<=100%,R2=r2預測XY之關係,並不依賴XY之間是否有因果關係迴歸直線之預測/解釋能力與相關性之強度有關係例子y=1425-19.9x〔x:溫度,y:瓦斯用量〕R2=r2=0.983*0.983=96.6%25最小平方迴歸Leastsquareregression迴歸分析臺北市之住宅整建費用及住戶月收入工具>資料分析>迴歸選取住宅整建費用reno_cost及住戶收入total-family-income二欄完成最小平方和迴歸直線reno_cost=6.47+0.49*total-family-incomeR2=0.006〔r=0.0783〕多重迴歸分析方程式y(tǒng)=a+b1x1+b2x2+…+bnxnR2=r2,r=因變數(shù)與所有自變數(shù)間之複相關係數(shù)26迴歸分析臺北市之住宅整建費用及住戶月收入26因果問題:因果關係〔causeandeffect〕實例X=父親之身高,Y=兒子之身高X=老鼠飼料中糖精份量,Y=老鼠膀胱中腫瘤個數(shù)因果關係虛線=XY間之相關性箭頭方向:X導致Y27因果問題:因果關係〔causeandeffect〕實例2因果問題:共同反映〔commonresponse〕實例X=中學教師之中位薪水,Y=酒類年銷售額Z:通貨膨脹,社會繁榮X=學生高三時之SAT計分,Y=該生大一之成績Z:能力,知識雖未有直接因果關係,仍可用x預測y共同反應Z為潛在變數(shù)28因果問題:共同反映〔commonresponse〕實例28因果問題:交絡〔confoundingeffect〕實例X=手術時使用之麻醉劑,Y=病人有無在手術中死亡Z:手術種類病人狀況=>決定手術種類及使用之麻醉劑重病患手術困難之麻醉劑,患者死亡率高X=在職者受教育之年數(shù),Y=在職者之收入Z:聰明程度與家境好壞高薪職位要求高教育水準家境好者,受較多之教育聰明又有錢者,不需教育,就能賺很多錢圖5-7(c),p.21429因果問題:交絡〔confoundingeffect〕實例2因果問題相關並不代表因果關係建立因果關係要找到因果關係之確切證據(jù),應使用隨機化比較實驗來消滅潛在變數(shù)之影響不能做實驗時,確立因果關係之標準相關性強相關有一致性〔如不同國度之研究結果〕高劑量與強反應相關原因在時間上超前結果原因是可信的注意是不是巧合?30因果問題相關並不代表因果關係303131九十一學年度第一學期
建築計量方法
統(tǒng)計三:變數(shù)間之關聯(lián)性杜功仁助理教授國立臺灣科技大學建築系2022/12/1132九十一學年度第一學期
建築計量方法
統(tǒng)計三:變數(shù)間之主題三:變數(shù)間之關聯(lián)性檢定變數(shù)間之關聯(lián)性之分析方法XY皆為名目尺度:雙向表/卡方檢定Y為連續(xù)變數(shù),X為名目尺度:變異數(shù)分析XY皆為連續(xù)變數(shù):散佈圖,相關係數(shù),迴歸分析參考文獻統(tǒng)計,讓數(shù)字說話?。旱谖逭?/p>
33主題三:變數(shù)間之關聯(lián)性檢定變數(shù)間之關聯(lián)性之分析方法2研究流程提出研究問題大膽假設閱讀、研究、思考後,提出假設/理論,概念與變數(shù)小心求證─研究設計量測計劃抽樣計劃進行量測/資料收計資料整理分析一:描述統(tǒng)計分析二:驗證所提出之理論是否成立獲得答案34研究流程提出研究問題3研究─資料分析第一步:了解每一變數(shù)之分佈狀況名目:各類所佔百分比順序,區(qū)間/比例:極大極小值,平均值,離散程度了解每一變數(shù)之是否有錯誤,特殊案例第二步:了解每兩個變數(shù)間之關係雙向表/卡方檢定:XY皆為名目尺度變異數(shù)分析:Y為順序,區(qū)間/比例〔連續(xù)變數(shù)〕,X為名目尺度相關係數(shù):XY皆為順序,區(qū)間/比例尺度〔連續(xù)變數(shù)〕35研究─資料分析第一步:了解每一變數(shù)之分佈狀況4變數(shù)間之關聯(lián)性〔association〕兩變數(shù)是‘相關聯(lián)的’對於同樣個體度量之兩個變數(shù),若其中一變數(shù)之值隨著另一變數(shù)之改變而規(guī)律地改變,稱之。統(tǒng)計學之重點在於驗證‘平均而言’會成立的一些關聯(lián)性,而非證明一些定律。實例矮的女性,心臟病發(fā)作之風險較高身高與體重每天抽較多煙者通常較每天抽較少煙者的壽命短F=ma36變數(shù)間之關聯(lián)性〔association〕兩變數(shù)是‘相關聯(lián)的’變數(shù)間關聯(lián)性之分析方法37變數(shù)間關聯(lián)性之分析方法6雙向表two-waytable誰得到較多學位?性別與學位描述關聯(lián)38雙向表two-waytable7辛普森詭論說明當組數(shù)資料合併成一組資料時,相關性本質可能會改變,甚至轉換方向。小心潛在變數(shù)三向表入學審查有性別歧視?表,p.19739辛普森詭論說明8雙向表/三向表臺北市住宅所有權及住宅類型資料>樞紐分析表Excel清單或資料庫選取hs_use及hs_type欄〔managed?〕移動hs_use及hs_type按鈕至表中之‘列’及‘欄’位置〔移動managed?按鈕至表中之‘分頁’位置〕移動hs_type按鈕至表中之‘資料’位置按兩下‘資料’中之按鈕,指定摘要方式為‘項目個數(shù)’,指定資料顯示方式為‘總列或總欄的百分比’所得之數(shù)字表即為雙向表〔三向表〕40雙向表/三向表臺北市住宅所有權及住宅類型9卡方檢定獨立性檢定檢測二屬性間有無關係檢定資料之次數(shù)分配或比例分配是否有關係運算實際觀察次數(shù)估計期望次數(shù)Eij=i列總和xj行總和/樣本數(shù)獨立性檢定統(tǒng)計量=Chi-square值〔Excel〕Excel>f(x)函數(shù)>CHITEST>得Chi-square機率值決策法則若Chi-square機率值<=a-pha值0.05,則拒絕H0若Chi-square機率值>a-pha值0.05,則接受H0〔二者無關係〕41卡方檢定獨立性檢定10卡方檢定卡方檢定之限制每一個cell的期望次數(shù)應大於5,否則檢定無效若樣本數(shù)增大時,Chi-square值增大,容易拒絕H0。臺北市住宅類型及有無整建是否有關係?使用上述之雙向表Excel>插入>函數(shù)>統(tǒng)計>CHITESTChi-square機率值=0.0004<a-pha值0.05,拒絕H0N=282642卡方檢定卡方檢定之限制11變異數(shù)分析AnalysisofVarianceANOVA分析重點檢測多個樣本/母體之某一因子之平均數(shù)是否有顯著差異F檢定統(tǒng)計量:因子變異數(shù)〔組間〕/隨機變異數(shù)〔組內(nèi)〕假設H0:各母體之某平均數(shù)相等H1:各母體之某平均數(shù)不全相等決策法則F機率值>=0.05,接受H0F機率值<0.05,拒絕H0圖12.1,P.45043變異數(shù)分析AnalysisofVarianceANOVA變異數(shù)分析AnalysisofVariance例子四種教學設計對於教學成效是否有影響?男性和女性員工以及三種不同機器對於產(chǎn)量是否有影響?香水之三種包裝設計與三條行銷通路對於銷售量之影響?分析方式單因子變異數(shù)分析雙因子變異數(shù)分析雙因子變異數(shù)分析44變異數(shù)分析AnalysisofVariance例子13單因子變異數(shù)分析,完全隨機設計例子四種教學設計對於教學成效是否有影響?45單因子變異數(shù)分析,完全隨機設計例子14單因子變異數(shù)分析,完全隨機設計臺北市各類住宅之平均面積是否有差異?將資料轉換成各類住宅之面積資料表工具>資料分析>單因子變異數(shù)分析輸入資料範圍得ANOVA表46單因子變異數(shù)分析,完全隨機設計臺北市各類住宅之平均面積是否有散佈圖什麼是散佈圖?顯示在同一個體上度量之二變數(shù)間之關聯(lián)性二變數(shù)為順序、區(qū)間、或比例尺度其中一變數(shù)在X軸,另一變數(shù)在Y軸每一對觀察值為散佈圖中之‘一個點’47散佈圖什麼是散佈圖?16散佈圖美國各州SAT計分之詮釋48散佈圖美國各州SAT計分之詮釋17散佈圖之詮釋形式叢聚方向正相關:X變大時,Y亦變大負相關:X變大時,Y變小強度點之分佈越接近一直線時,關聯(lián)性越強偏離值突顯出偏離整體型態(tài)之一些個別觀察值〔主觀判對〕49散佈圖之詮釋形式18散佈圖臺北市住宅之住宅面積及總房間數(shù)插入>圖表>XY散佈圖選取住宅面積及總房間數(shù)二欄完成50散佈圖臺北市住宅之住宅面積及總房間數(shù)19相關係數(shù)什麼是相關係數(shù)?描述兩個變數(shù)之間線性〔only〕關聯(lián)之方向及強度用符號r表示-1<=r<=1使用統(tǒng)計軟體計算相關係數(shù)之意義r為正值=正相關,r為負值=負相關0<=|r|<0.3,弱度線性相關
0.3<=|r|<0.7,中度線性相關
0.7<=|r|<1.0,強度線性相關51相關係數(shù)什麼是相關係數(shù)?20相關係數(shù)52相關係數(shù)21相關係數(shù)臺北市住宅之住宅面積及總房間數(shù)工具>資料分析>相關係數(shù)選取住宅面積area
及總房間數(shù)total-rm二欄完成臺北市之住宅整建費用及住戶月收入reno_cost,total-family-income53相關係數(shù)臺北市住宅之住宅面積及總房間數(shù)22迴歸直線Regressionline迴歸直線是一條直線,描述因變數(shù)如何隨著自變數(shù)之改變而變用來預測:當X=某個值時,Y值會是多少?需先定義自變數(shù)及因變數(shù)〔不同於相關係數(shù)〕54迴歸直線Regressionline迴歸直線23最小平方迴歸LeastsquareregressionY對X之最小平方迴歸直線使得所有點距離直線之垂直Y方向距離平方和為最小之直線容易受到少數(shù)離群點outliers之嚴重影響迴歸方程式y(tǒng)=a+bxa:截距intercept,當x=0時之y值b:斜率,當x增加一個單位時,y值之改變量例子y=1425-19.9x〔x:溫度,y:瓦斯用量〕x=30,=>y=1425-19.9*30=82855最小平方迴歸Leastsquareregression最小平方迴歸Leastsquareregression迴歸裡的R2Y值之變異中,可以被Y對X之最小平方迴歸直線解釋之部分所佔百分比。XY之間的直線關係只能解釋部分Y之變異,而非全部。=Y預測值隨著x值沿直線移動時產(chǎn)生之變異/Y觀測值總變異0%<=R2<=100%,R2=r2預測XY之關係,並不依賴XY之間是否有因果關係迴歸直線之預測/解釋能力與相關性之強度有關係例子y=1425-19.9x〔x:溫度,y:瓦斯用量〕R2=r2=0.983*0.983=96.6%56最小平方迴歸Leastsquareregression迴歸分析臺北市之住宅整建費用及住戶月收入工具>資料分析>迴歸選取住宅整建費用reno_cost及住戶收入total-f
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論